జెమిని 3.5 లైవ్ ట్రాన్స్లేట్ అనే సరికొత్త స్పీచ్-టు-స్పీచ్ ఏఐ మోడల్ను పరిచయం చేసింది
Photo Credit: Google
Gemini 3.5 Live Translate
Google : ప్రపంచవ్యాప్తంగా ఇంటర్నెట్ వినియోగదారులకు కమ్యూనికేషన్ను మరింత సులభతరం చేసే దిశగా గూగుల్ ఒక పెద్ద అడుగు వేసింది. దాదాపు రెండు దశాబ్దాల క్రితం మెషిన్ లెర్నింగ్ ప్రయోగంగా ప్రారంభమైన అనువాద ప్రయత్నాలలో సరికొత్త మైలురాయిని తాకుతూ జెమిని 3.5 లైవ్ ట్రాన్స్లేట్ అనే సరికొత్త స్పీచ్-టు-స్పీచ్ ఏఐ మోడల్ను పరిచయం చేసింది. మనుషులు ఒకరితో ఒకరు మాట్లాడుకునేటప్పుడు ఎంత సహజంగా సంభాషిస్తారో, అదే రీతిలో వివిధ భాషల మధ్య లైవ్ అనువాదం జరగాలనే ఆశయంతో దీన్ని డిజైన్ చేశారు.
మాట్లాడుతున్నప్పుడే రియల్ టైమ్ అనువాదం
గూగుల్ అధికారిక బ్లాగ్ పోస్ట్ ప్రకారం.. ఈ కొత్త ఏఐ మోడల్ ఆడియో స్ట్రీమ్ అవుతున్న సమయంలోనే దాన్ని రియల్ టైమ్ లో ప్రాసెస్ చేస్తుంది. అంటే ఒరిజినల్ స్పీకర్ మాట్లాడుతున్న కొన్ని సెకన్ల వ్యవధిలోనే ఇది అనువాద ఆడియోను జనరేట్ చేస్తుంది. పాతకాలపు సాంప్రదాయ అనువాద వ్యవస్థల లాగా ఒకరు మాట్లాడటం ఆపిన తర్వాత కాసేపు ఆగి అనువదించాల్సిన అవసరం దీనికి లేదు. దీనివల్ల ఇద్దరు వేర్వేరు భాషల వ్యక్తుల మధ్య సంభాషణలు ఎక్కడా ఆగిపోకుండా ఎంతో సహజంగా సాగుతాయి. మల్టీలింగ్వల్ మీటింగులు, లైవ్ బ్రాడ్కాస్ట్లు, ఆన్లైన్ పాఠాలు, కస్టమర్ కేర్ సపోర్ట్ రంగాలకు ఇది ఎంతో ఉపయోగపడనుంది.
70కి పైగా భాషల గుర్తింపు.. మాన్యువల్ సెట్టింగ్స్ అవసరం లేదు
ఈ కొత్త జెమిని మోడల్ ప్రపంచవ్యాప్తంగా ఉన్న 70 కంటే ఎక్కువ భాషలను ఆటోమేటిక్ గా గుర్తించగలదు. ఇందులో అత్యంత అద్భుతమైన ఫీచర్ ఏంటంటే, మనం ఫోన్ లో ఏ భాష నుంచి ఏ భాషలోకి మార్చాలనే సెట్టింగ్స్ ను మాన్యువల్ గా మార్చాల్సిన అవసరం లేదు. యూజర్ మాట్లాడుతున్న వాయిస్ ని బట్టి ఏఐ స్వయంగా భాషను గుర్తిస్తుంది. అంతేకాకుండా, చుట్టుపక్కల విపరీతమైన గోల లేదా శబ్దాలు ఉన్నప్పటికీ, ఇది ఎంతో ఖచ్చితత్వంతో వాయిస్ ను క్యాచ్ చేసి అనువదించగలదు. అనువాదం చేసే సమయంలో స్పీకర్ టోన్, మాట్లాడే వేగం, శైలిని కూడా ఇది యథావిధిగా కాపాడుతుంది.
గూగుల్ మీట్, మొబైల్ యాప్స్ లోకి సరికొత్త ఫీచర్లు
ఈ సరికొత్త అప్గ్రేడ్ ఫీచర్లు గూగుల్ మీట్ వీడియో కాలింగ్ యాప్ లోకి కూడా వస్తున్నాయి. గతంలో గూగుల్ మీట్ కేవలం ఐదు భాషల అనువాదానికి మాత్రమే సపోర్ట్ చేయగా, ఇకపై 70కి పైగా భాషల్లో లైవ్ అనువాదాన్ని అందించనుంది. దీనితో పాటు ఆండ్రాయిడ్, ఐఓఎస్ లలోని గూగుల్ ట్రాన్స్లేట్ యాప్ లో కూడా జెమిని 3.5 లైవ్ ట్రాన్స్లేట్ అందుబాటులోకి రానుంది. యూజర్లు తమ ఫోన్కు కనెక్ట్ చేసిన ఎలాంటి బ్లూటూత్ హెడ్ఫోన్స్ ద్వారా అయినా సరే ఈ లైవ్ అనువాదాన్ని నేరుగా వినవచ్చు. ముఖ్యంగా ఆండ్రాయిడ్ వినియోగదారుల కోసం ఒక ప్రత్యేక లిజనింగ్ మోడ్ను కూడా తెచ్చారు, దీని ద్వారా అనువాద ఆడియోను నేరుగా ఫోన్ ఇయర్పీస్ లోనే వినడానికి వీలవుతుంది.
Samsung : రూ.60 వేల లోపే శామ్సంగ్ ఫ్లిప్ ఫోన్.. అమెజాన్లో అదిరిపోయే బంపర్ డిస్కౌంట్
ఫేక్ కంటెంట్ నిరోధానికి సింథ్ ఐడీ రక్షణ
ప్రస్తుత రోజుల్లో ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ సృష్టిస్తున్న నకిలీ ఆడియోలు, డీప్ఫేక్ల పట్ల సర్వత్రా ఆందోళనలు వ్యక్తమవుతున్నాయి. దీనికి అడ్డుకట్ట వేసేందుకు గూగుల్ ఒక కీలకమైన భద్రతా ఫీచర్ ను జోడించింది. జెమిని 3.5 లైవ్ ట్రాన్స్లేట్ ద్వారా జనరేట్ అయ్యే ప్రతి ఆడియోలో గూగుల్ కి చెందిన వాటర్మార్కింగ్ సాంకేతికత సింథ్ ఐడీని పొందుపరిచారు. ఇది ఆడియో ఫైల్ లోపలే డిజిటల్ రూపంలో కలిసిపోతుంది. దీనివల్ల భవిష్యత్తులో ఆ ఆడియోను ఎవరైనా పరిశీలిస్తే, అది మనుషులు మాట్లాడింది కాదని, గూగుల్ ఏఐ ద్వారా సృష్టించబడిన కంటెంట్ అని సులభంగా గుర్తించవచ్చు.
డెవలపర్లకు యాక్సెస్, గ్లోబల్ రోలౌట్
సాఫ్ట్వేర్ డెవలపర్లు ఈ సరికొత్త వాయిస్ అనువాద సాంకేతికతను ఉపయోగించుకుని తమ స్వంత అప్లికేషన్లను తయారుచేసుకోవడానికి గూగుల్ పబ్లిక్ ప్రివ్యూను అందుబాటులోకి తెచ్చింది. గూగుల్ ఏఐ స్టూడియో, జెమిని లైవ్ ఏపీఐ ద్వారా డెవలపర్లు దీనిని యాక్సెస్ చేయవచ్చు. అగోరా, ఫిష్జామ్, లైవ్కిట్, పైప్క్యాట్, విజన్ ఏజెంట్స్ వంటి ప్రముఖ ప్లాట్ఫారమ్లతో దీనికి కనెక్షన్ ఇచ్చారు. ఈ సరికొత్త ఏఐ మోడల్ ప్రపంచవ్యాప్తంగా సపోర్ట్ ఉన్న అన్ని గూగుల్ ప్రొడక్ట్స్లో ఈరోజు నుంచే అధికారికంగా రోలౌట్ అవుతోంది.
ప్రకటన
ప్రకటన