ఇప్పటి వరకు వచ్చిన మోడల్లతో పోలిస్తే GPT-5.2 థింకింగ్ చార్ట్ రీజనింగ్, సాఫ్ట్వేర్-ఇంటర్ఫేస్ అవగాహనపై ఎర్రర్ రేట్లను సగానికి తగ్గిస్తుంది.
Photo Credit: OpenAI
GPT-5.2 GPT-5.1తో పోల్చితే భ్రాంతి రేటును 30% తగ్గిస్తుంది; గుర్తించబడని ChatGPT ప్రశ్నల ఆధారంగా ఇది
OpenAI నుంచి చాట్ జీపీటీలో కొత్త వర్షెన్ మార్కెట్లోకి వచ్చింది. గురువారం నాడు కంపెనీ ప్రొఫెషనల్ నాలెడ్జ్ వర్క్ కోసం అత్యంత సమర్థవంతమైన మోడల్ సిరీస్ అయిన GPT-5.2 ను ప్రవేశపెట్టింది. ఎంటర్ప్రైజెస్లలో ChatGPTని నిరంతరం వాడుకుంటూనే ఉన్నారు. దీంతో ఈ వర్షెన్కు అప్డేట్ను తీసుకు వచ్చారు. ఇక్కడ సాధారణ వినియోగదారులు ఈ చాట్ జీపీటీతో రోజుకు 40–60 నిమిషాలు ఆదా చేస్తున్నట్లు నివేదికలు చెబుతున్నాయి. ఇక ఈ అప్డేట్తో వినియోగదారులు వారానికి 10 గంటల కంటే ఎక్కువ ఆదా చేయనున్నట్టుగా తెలుస్తోంది.
GPT-5.2 ప్రొడక్టివిటీ ప్రభావాన్ని విస్తరించడానికి రూపొందించబడింది. స్ప్రెడ్షీట్లను సృష్టించడం, ప్రెజెంటేషన్లను రూపొందించడం, కోడ్ రాయడం, చిత్రాలను వివరించడం, పొడవైన పత్రాలను నిర్వహించడం, సాధనాలను ఉపయోగించడం, సంక్లిష్టమైన మల్టీ ఫేజ్డ్ వర్క్ఫ్లోలను నిర్వహించడంలో మోడల్ మెరుగుపడుతుంది. H100, H200, GB200-NVL72 GPUల ద్వారా ఆధారితమైన Azure డేటా సెంటర్లను ఉపయోగించి NVIDIA, Microsoft సహకారంతో ఈ విడుదల అభివృద్ధి చేయబడింది.
వినియోగదారులు మూడు GPT-5.2 అనుభవాలలో మరింత నిర్మాణాత్మక, స్థిరమైన ప్రవర్తనను అనుభవించాలి:
GPT-5.2 ఇన్ స్టంట్: సమాచారం కోసం శోధించడం, సాంకేతిక రచన, అనువాదాలు, దశల వారీ మార్గదర్శకత్వంలో మెరుగుదలలతో వేగవంతమైన ప్రతిస్పందనలు.
GPT-5.2 థింకింగ్ : కోడింగ్, దీర్ఘ-పత్ర సారాంశం, గణితం, తర్కం, బహుళ-దశల పనులతో కూడిన లోతైన పని కోసం రూపొందించబడింది.
GPT-5.2 ప్రో : అధిక-నాణ్యత తార్కికం ఎక్కువ ప్రతిస్పందన సమయాలకు విలువైన క్లిష్టమైన ప్రశ్నల కోసం ఉద్దేశించబడింది.
మోడల్ నామకరణ
GPT-5.2 GDPvalతో సహా బహుళ మూల్యాంకనాలలో కొత్త అత్యాధునిక ఫలితాలను సెట్ చేస్తుంది. ఇక్కడ ఇది 44 వృత్తులలో విస్తరించి ఉన్న బాగా-నిర్దిష్ట జ్ఞాన పనులపై పరిశ్రమ నిపుణులను అధిగమిస్తుంది.
నోషన్, బాక్స్, షాపిఫై, హార్వే, జూమ్ వంటి భాగస్వాములు బలమైన లాంగ్-హారిజోన్ రీజనింగ్, టూల్-కాలింగ్ పనితీరును నివేదించారు. డేటాబ్రిక్స్, హెక్స్, ట్రిపుల్ వేల్ ఏజెంట్-ఆధారిత డేటా సైన్స్, డాక్యుమెంట్ విశ్లేషణలో లాభాలను గుర్తించాయి. కాగ్నిషన్, వార్ప్, చార్లీ ల్యాబ్స్, జెట్బ్రెయిన్స్, ఆగ్మెంట్ కోడ్ అధిక ఏజెంట్ కోడింగ్ పనితీరును గమనించాయి.
GPT-5.2 థింకింగ్ GDPvalలో OpenAI అత్యధిక పనితీరును సాధించింది. మానవ నిపుణుల స్థాయిలను సరిపోల్చడానికి లేదా అధిగమించడానికి కంపెనీ మొదటి మోడల్గా నిలిచింది. ఇది 70.9% పోలికలలో అగ్ర నిపుణులను కలుపుతుంది లేదా అధిగమిస్తుంది. ఈ మోడల్ GDPval అవుట్పుట్లను 11× కంటే ఎక్కువ వేగంగా, నిపుణులైన నిపుణుల ఖర్చులో 1% కంటే తక్కువకు ఉత్పత్తి చేసింది.
GDPval మూల్యాంకనం చేసేవారు ఒక అవుట్పుట్ను "అవుట్పుట్ నాణ్యతలో గుర్తించదగిన లీపు... సిబ్బందితో ఒక ప్రొఫెషనల్ కంపెనీ ద్వారా చేయబడింది" అని వర్ణించారు. అయితే ఇందులో చిన్న లోపాలు మిగిలి ఉన్నాయని గుర్తించారు.
జూనియర్ ఇన్వెస్ట్మెంట్-బ్యాంకింగ్ మోడలింగ్ పనుల కోసం OpenAI అంతర్గత బెంచ్మార్క్లో - త్రీ-స్టేట్మెంట్ మోడల్లను నిర్మించడం లేదా లివరేజ్డ్ బైఅవుట్ మోడల్లు వంటివి - మోడల్ సగటు స్కోరు 59.1% నుండి 68.4%కి పెరిగింది, ఇది GPT-5.1 కంటే 9.3% మెరుగుదల.
GPT-5.2 థింకింగ్ SWE-Bench Proలో 55.6% కొత్త అధిక స్కోర్ను సెట్ చేస్తుంది. ఇది నాలుగు ప్రోగ్రామింగ్ భాషలలో వాస్తవ-ప్రపంచ ఇంజనీరింగ్ పనులను మూల్యాంకనం చేస్తుంది. SWE-Bench Verified బెంచ్మార్క్లో, ఇది 80% సాధించింది, ఇది OpenAI నుండి ఇప్పటివరకు అత్యధికం.
డీబగ్గింగ్, ఫీచర్ అమలు, కోడ్ రీఫ్యాక్టరింగ్, ఎండ్-టు-ఎండ్ పరిష్కారాలలో ఈ మోడల్ బలమైన పనితీరును చూపుతుంది. సంక్లిష్టమైన UI పని, 3D ఇంటర్ఫేస్ పనులు సహా ఫ్రంట్-ఎండ్ అభివృద్ధిలో ప్రారంభ పరీక్షకులు మెరుగైన ఫలితాలను కూడా నివేదించారు.
GPT-5.2 GPT-5.1 ఆలోచనతో పోలిస్తే భ్రాంతి (హాలుజినేషన్) రేటును 30% తగ్గిస్తుంది. ఇది గుర్తించబడని ChatGPT ప్రశ్నల ఆధారంగా ఉంటుంది. ఇది పరిశోధన, రచన, విశ్లేషణ, నిర్ణయ మద్దతు కోసం విశ్వసనీయతను మెరుగుపరుస్తుంది.
GPT-5.2 థింకింగ్ MRCRv2 పై కొత్త అత్యాధునిక ఫలితాలను అందిస్తుంది. ఇది పొడవైన పత్రాలలో సమాచారాన్ని ఏకీకృతం చేసే మోడల్ సామర్థ్యాన్ని పరీక్షించడానికి రూపొందించబడింది.
ఇది 256k టోకెన్ల వరకు 4-నీడిల్ MRCR టాస్క్పై దాదాపు పరిపూర్ణ ఖచ్చితత్వాన్ని చేరుకుంటుంది, నివేదికలు, ఒప్పందాలు, పరిశోధన పత్రాలు, ట్రాన్స్క్రిప్ట్లు, బహుళ-ఫైల్ ప్రాజెక్ట్లతో కూడిన వర్క్ఫ్లోల కోసం పొందిక, ఖచ్చితత్వాన్ని మెరుగుపరుస్తుంది.
ఈ మోడల్ OpenAI కొత్త ప్రతిస్పందనలు / కాంపాక్ట్ ఎండ్పాయింట్కు కూడా మద్దతు ఇస్తుంది. సాధనం-భారీ, దీర్ఘకాలిక పనులకు ప్రభావవంతమైన సందర్భాన్ని విస్తరిస్తుంది.
మునుపటి మోడల్లతో పోలిస్తే GPT-5.2 థింకింగ్ చార్ట్ రీజనింగ్, సాఫ్ట్వేర్-ఇంటర్ఫేస్ అవగాహనపై ఎర్రర్ రేట్లను సగానికి తగ్గిస్తుంది. ఇది చిత్రాలలో ప్రాదేశిక సంబంధాలు, మూలకాల స్థాన నిర్ధారణపై మెరుగైన అవగాహనను చూపుతుంది, డాష్బోర్డ్లు, రేఖాచిత్రాలు, ఉత్పత్తి స్క్రీన్షాట్లు, సాంకేతిక విజువల్స్ మరింత ఖచ్చితమైన వివరణను అనుమతిస్తుంది.
తక్కువ-నాణ్యత చిత్రాలపై బౌండింగ్-బాక్స్ పరీక్షలలో, GPT-5.2 GPT-5.1 కంటే మెరుగైన స్పేషియల్ గ్రూపింగ్తో ఎక్కువ భాగాలను సరిగ్గా గుర్తించిందని OpenAI పేర్కొంది. అయినప్పటికీ రెండు నమూనాల్లో ఇప్పటికీ కొన్ని లోపాలు ఉన్నాయి.
Tau2-బెంచ్ టెలికామ్లో GPT-5.2 థింకింగ్ 98.7%కి చేరుకుంది. ఇది దీర్ఘ, బహుళ-మలుపు సాధన-ఉపయోగ వర్క్ఫ్లోలలో బలమైన విశ్వసనీయతను ప్రదర్శిస్తుంది. ఇది reasoning.effort='none'తో కూడా గణనీయంగా మెరుగ్గా పనిచేస్తుంది, జాప్యం-సున్నితమైన వినియోగ కేసులను మెరుగుపరుస్తుంది.
కస్టమర్-సపోర్ట్ దృశ్యాలు వంటి బహుళ-ఏజెంట్ సెటప్లలో, GPT-5.2 సమన్వయంతో కూడిన పూర్తి వర్క్ఫ్లోలు - రీబుకింగ్, స్పెషల్-అసిస్టెన్స్ సీటింగ్, పరిహారం - GPT-5.1 పాక్షిక ఫలితాలను అందించాయి.
గణాంక అభ్యాస సిద్ధాంతంలో బహిరంగ ప్రశ్నను అన్వేషించడానికి పరిశోధకులు ఇటీవల GPT-5.2 Proని నియంత్రిత సెట్టింగ్లో ఉపయోగించారని OpenAI పేర్కొంది. ఈ నమూనా తరువాత రచయితలు ధృవీకరించిన, బాహ్య నిపుణులచే సమీక్షించబడిన ఒక రుజువును ప్రతిపాదించింది.
ARC-AGI-1 (ధృవీకరించబడిన)లో 90%ని అధిగమించిన మొదటి మోడల్ GPT-5.2 Pro, గత సంవత్సరం o3-ప్రివ్యూ స్కోర్ అయిన 87% నుండి మెరుగుపడింది, ఆ పనితీరును సాధించడానికి అయ్యే ఖర్చును దాదాపు 390× తగ్గించింది.
ARC-AGI-2 (ధృవీకరించబడిన)లో, GPT-5.2 థింకింగ్ 52.9% సాధిస్తుంది, అయితే GPT-5.2 Pro 54.2%కి చేరుకుంటుంది, ఇది బలమైన బహుళ-దశల తార్కికం, వియుక్త సమస్య పరిష్కారాన్ని ప్రతిబింబిస్తుంది.
GPT-5.2 GPT-5తో ప్రవేశపెట్టబడిన భద్రతా మెరుగుదలలపై ఆధారపడుతుంది. స్వీయ-హాని, మానసిక-ఆరోగ్య బాధ, AIపై భావోద్వేగ అతిగా ఆధారపడటం వంటి సున్నితమైన సంభాషణలలో మరింత నమ్మదగిన ప్రతిస్పందనలను లక్ష్యంగా చేసుకుంటుంది. GPT-5.2 ఇన్స్టంట్, థింకింగ్ రెండూ GPT-5.1 మోడళ్ల కంటే తక్కువ అవాంఛనీయ అవుట్పుట్లను చూపుతాయి.
OpenAIలో ఇప్పటికే ఉన్న పేరెంటల్ కంట్రోలింగ్ సిస్టంతో పాటుగా 18 ఏళ్లలోపు వినియోగదారులకు కంటెంట్ ప్రొటెక్షన్స్ కోసం ఆటోమేటిక్గా వయస్సు-అంచనా వేసే నమూనాను కూడా రూపొందిస్తోంది. భద్రత, విశ్వసనీయతను మెరుగుపరుస్తూనే ఉన్నందున అతిగా తిరస్కరణలు రావని కంపెనీ భావిస్తోంది.
లభ్యత, ధర
GPT-5.2 (ఇన్స్టంట్, థింకింగ్, ప్రో) ఈరోజు ChatGPTలో ప్లస్, ప్రో, గో, బిజినెస్, ఎంటర్ప్రైజ్ వినియోగదారుల కోసం అందుబాటులోకి రావడం ప్రారంభమైంది. విస్తరణ క్రమంగా ఉంటుంది. ఆల్రెడీ పెయిడ్ యూజర్లకు సూర్యాస్తమయం కావడానికి ముందు లెగసీ మోడల్ల కింద GPT-5.1 మూడు నెలల పాటు అందుబాటులో ఉంటుంది.
GPT-5.2 Pro, థింకింగ్ ఇప్పుడు కొత్త xhigh రీజనింగ్-ఎఫర్ట్ లెవల్కు మద్దతు ఇస్తుంది. స్ప్రెడ్షీట్, ప్రెజెంటేషన్ సాధనాలకు ప్లస్, ప్రో, బిజినెస్ లేదా ఎంటర్ప్రైజ్ ప్లాన్లపై GPT-5.2 థింకింగ్ లేదా ప్రో అవసరం.
మల్టీ ఏజెంట్ ఎవాల్యుయేషన్స్పై ఎక్కువ టోకెన్ సామర్థ్యం ద్వారా GPT-5.2 అధిక ప్రతి-టోకెన్ ఖర్చును భర్తీ చేయవచ్చని OpenAI చెబుతోంది. APIలో GPT-5.1, GPT-5, లేదా GPT-4.1 కోసం ప్రస్తుత డీప్రెకేషన్ ప్లాన్లు లేవు. కోడెక్స్-ఆప్టిమైజ్ చేయబడిన GPT-5.2 వేరియంట్ త్వరలో వచ్చే అవకాశం ఉంది.
ప్రకటన
ప్రకటన
Astronomers Observe Star’s Wobbling Orbit, Confirming Einstein’s Frame-Dragging
Chandra’s New X-Ray Mapping Exposes the Invisible Engines Powering Galaxy Clusters