AI अद्यतने कमी होत नाहीत. अक्षरशः OpenAI ने ChatGPT साठी GPT-5.3 इन्स्टंट नावाचे नवीन कोर AI मॉडेल जारी केल्यानंतर दोन दिवसांनी, कंपनीने आणखी एक, अधिक मोठ्या अपग्रेडचे अनावरण केले: GPT-5.4.
खरं तर, GPT-5.4 दोन प्रकारात येतो: GPT-5.4 थिंकिंग आणि GPT-5.4 प्रोनंतरचे अधिक जटिल कार्यांसाठी डिझाइन केलेले आहे.
दोन्ही OpenAI च्या सशुल्क ॲप्लिकेशन प्रोग्रामिंग इंटरफेस (API) आणि कोडेक्स सॉफ्टवेअर डेव्हलपमेंट ॲपमध्ये उपलब्ध असतील, तर GPT-5.4 Thinking ChatGPT (अधिक $20/महिना योजना आणि त्याहून अधिक) सर्व सशुल्क सदस्यांसाठी उपलब्ध असेल आणि Pro ChatGPT Pro ($200/महिना) आणि एंटरप्राइझ प्लॅन वापरकर्त्यांसाठी राखीव असेल.
ChatGPT मोफत वापरकर्त्यांना GPT-5.4 चा अनुभव देखील मिळेल, परंतु जेव्हा त्यांच्या क्वेरी स्वयंचलितपणे फॉर्मवर राउट केल्या जातील तेव्हाच, OpenAI प्रवक्त्याने सांगितले.
या प्रकाशनातील मथळे कार्यक्षमता आहेत, ओपनएआयने अहवाल दिला आहे की GPT-5.4 त्याच्या पूर्ववर्तींच्या तुलनेत लक्षणीयरीत्या कमी टोकन्स वापरते (काही कार्यांवर 47% कमी), आणि ते अधिक प्रभावी आहे. नवीन "स्थानिक" PC वापर मोड API आणि त्याच्या स्क्रिप्टद्वारे उपलब्ध आहे GPT-5.4 वापरकर्त्यांना त्यांचा संगणक मानवाप्रमाणे नेव्हिगेट करण्यास आणि सर्व अनुप्रयोगांवर कार्य करण्यास अनुमती देते.
कंपनी देखील जारी करत आहे ChatGPT एकत्रीकरणाचा एक नवीन संच जो GPT-5.4 ला थेट वापरकर्त्यांच्या Microsoft Excel आणि Google Sheets मध्ये प्लग इन करण्याची परवानगी देतो स्प्रेडशीट्स आणि सेल, अचूक विश्लेषण आणि स्वयंचलित कार्य पूर्ण करणे सक्षम करून, संपूर्ण संस्थेमध्ये कामाचा वेग वाढवतात, परंतु Anthropic’s Claude आणि त्याच्या नवीन Cowork ॲपच्या समान ऑफरच्या पार्श्वभूमीवर व्हाईट-कॉलर टाळेबंदीची भीती अधिक स्पष्ट होऊ शकते.
OpenAI म्हणते की GPT-5.4 API आणि Codex मध्ये 1 दशलक्ष कॉन्टेक्स्ट टोकन्सला सपोर्ट करते, एजंटना लांब क्षितिजावरील कार्यांची योजना, कार्यान्वित आणि पडताळणी करण्यास सक्षम करते — तथापि, एकदा इनपुट 272,000 टोकन्स ओलांडल्यानंतर प्रति दशलक्ष टोकन्सच्या दुप्पट किंमत आकारते.
नेटिव्ह पीसी वापर: स्वायत्त कार्यप्रवाहाकडे एक पाऊल
OpenAI द्वारे हायलाइट केलेली सर्वात महत्वाची क्षमता म्हणजे GPT-5.4 हे नेटिव्ह, अत्याधुनिक कोडेक्स आणि API संगणन क्षमतांसह जारी केलेले पहिले सामान्य-उद्देश मॉडेल आहे, जे एजंटना संगणक ऑपरेट करण्यास आणि सर्व अनुप्रयोगांवर बहु-चरण कार्यप्रवाह कार्यान्वित करण्यास सक्षम करते.
OpenAI म्हणते की मॉडेल प्लेराइट सारख्या लायब्ररीद्वारे संगणक ऑपरेट करण्यासाठी कोड लिहू शकतो आणि स्क्रीनशॉटच्या प्रतिसादात माउस आणि कीबोर्ड कमांड जारी करू शकतो. ओपनएआयने प्रॉक्सी वेब ब्राउझिंगमध्येही झेप घेतल्याचा दावा केला आहे.
बेंचमार्क परिणाम हे केवळ UI रॅपर नसल्याचा पुरावा म्हणून सादर केले जातात.
BrowseComp मध्ये, जे शोधून काढण्यासाठी कठीण माहिती शोधण्यासाठी AI एजंट सतत वेब ब्राउझ करण्यास किती सक्षम आहेत याचे मोजमाप करते, OpenAI ने GPT-5.4 वर GPT-5.2 पेक्षा 17% परिपूर्ण सुधारणा केल्याचा अहवाल दिला आहे आणि GPT-5.4 Pro 89.3% पर्यंत पोहोचला आहे, ज्याचे वर्णन प्रगतीची नवीन स्थिती आहे.
OSWorld-Verified मध्ये, जे स्क्रीनशॉट तसेच कीबोर्ड आणि माउस क्रियांचा वापर करून डेस्कटॉप नेव्हिगेशनचे मोजमाप करते, OpenAI ने GPT-5.4 च्या यशाची 75.0% नोंद केली, GPT-5.2 साठी 47.3% च्या तुलनेत, आणि फीडबॅकने मानवी कार्यप्रदर्शन 72.4% नोंदवले.
WebArena-Verified वर, GPT-5.4 ने GPT-5.2 साठी 65.4% च्या तुलनेत DOM-आधारित परस्परसंवाद आणि स्क्रीनशॉट वापरून 67.3% यश मिळवले. Online-Mind2Web वर, OpenAI ने केवळ स्क्रीनशॉटवर आधारित फीडबॅक वापरून 92.8% यश मिळवले.
ओपनएआय संगणकाच्या वापरास दृष्टी आणि दस्तऐवज प्रक्रियेतील सुधारणांशी जोडते. MMMU-Pro मध्ये, GPT-5.4 ने टूल न वापरता 81.2% यश मिळवले, GPT-5.2 साठी 79.5% च्या तुलनेत, आणि OpenAI म्हणते की ते “थिंकिंग कोड्स” चा एक छोटासा भाग वापरून हा परिणाम साध्य करते.
OmniDocBench मध्ये, GPT-5.4 साठी सरासरी त्रुटी 0.109 वर नोंदवली गेली, GPT-5.2 साठी 0.140 वरून सुधारली. पोस्टमध्ये 10.24 दशलक्ष पिक्सेल पर्यंतच्या “नेटिव्ह” तपशील पातळीसह उच्च-रिझोल्यूशन इमेज इनपुटसाठी विस्तारित समर्थनाचे वर्णन देखील केले आहे.
ओपनएआय दीर्घ, बहु-चरण वर्कफ्लोसाठी डिझाइन केलेले GPT-5.4 वैशिष्ट्यीकृत करते – एक-वेळच्या चॅटबॉट प्रतिसादाऐवजी अनेक क्रियांमध्ये स्थिती राखणाऱ्या एजंटसारखे कार्य.
विजेट शोधा आणि विजेट स्वरूपन सुधारा
टूल इकोसिस्टम आकारात वाढत असताना, OpenAI असा युक्तिवाद करते की एक साधा दृष्टीकोन-प्रत्येक टूलची व्याख्या राउटरमध्ये टाकणे-प्रत्येक विनंतीवर टोल निर्माण करते: खर्च, विलंबता आणि संदर्भ प्रदूषण.
GPT-5.4 स्ट्रक्चरल फिक्स म्हणून API मध्ये टूल सर्चिंगचा परिचय देते. सर्व टूल व्याख्या अगोदर प्राप्त करण्याऐवजी, मॉडेलला साधने तसेच शोध क्षमतांची हलकी यादी प्राप्त होते आणि जेव्हा त्यांना प्रत्यक्षात आवश्यक असेल तेव्हाच संपूर्ण टूल व्याख्या प्राप्त होतात.
ओपनएआय कार्यक्षमतेच्या विजयाचे एका ठोस तुलनासह वर्णन करते: स्केलच्या MCP ऍटलस बेंचमार्कच्या 250 कार्यांमध्ये, 36 MCP-सक्षम सर्व्हरसह चालत आहे, टूल-फाइंडिंग कॉन्फिगरेशनने एकूण टोकन वापर 47% कमी केला आहे आणि कॉन्फिगरेशन प्रमाणेच अचूकता प्राप्त केली आहे जी सर्व संदर्भ MCP मध्ये थेट उघड करते.
ही 47% संख्या विशेषत: या मूल्यमापनातील टूल शोध सेटिंगशी संबंधित आहे आणि GPT-5.4 प्रत्येक प्रकारच्या कार्यासाठी 47% कमी कोड वापरते असा दावा नाही.
विकासक आणि कोडिंग वर्कफ्लोसाठी सुधारणा
ओपनएआय कोडेक्सची कल्पना अशी आहे की जीपीटी-5.4 हे जीपीटी-5.3-कोडेक्सच्या क्रिप्टोग्राफिक सामर्थ्यांसह मजबूत टूलिंग आणि संगणन क्षमता एकत्र करते जे जेव्हा कार्ये एक-शॉट नसतात तेव्हा महत्त्वपूर्ण असतात.
GPT-5.4 जुळते किंवा SWE-Bench Pro मधील GPT-5.3-Codex पेक्षा जास्त प्रदर्शन करते आणि अनुमान प्रयत्नांमध्ये कमी विलंब होतो.
कोडेक्सला वर्कफ्लो-स्तरीय हँडल देखील मिळतात. ओपनएआय म्हणते की फास्ट मोड समर्थित मॉडेल्सवर 1.5x पर्यंत जलद कार्यप्रदर्शन देते, जीपीटी-5.4 सह, त्याच मॉडेल आणि बुद्धिमत्ता “फक्त जलद” असे वर्णन करते.
हे प्रायोगिक कोडेक्स कौशल्य, “प्लेराइट (इंटरएक्टिव्ह)” च्या प्रकाशनाचे वर्णन करते, ज्याचा उद्देश प्रोग्रामिंग आणि संगणक कसे काम करतात हे प्रदर्शित करणे – वेब आणि इलेक्ट्रॉन ऍप्लिकेशन्सचे दृश्यमानपणे डीबग करणे आणि अनुप्रयोग तयार करताना चाचणी करणे.
Microsoft Excel आणि Google Sheets साठी OpenAI
GPT-5.4 सोबत, OpenAI ChatGPT मध्ये सुरक्षित AI उत्पादनांचा एक संच घोषित करत आहे, जी एंटरप्राइजेस आणि वित्तीय संस्थांसाठी डिझाइन केलेली आहे, जीपीटी-5.4 द्वारे प्रगत आर्थिक तर्क आणि एक्सेल-आधारित मॉडेलिंगसाठी.
केंद्रबिंदू आहे एक्सेल आणि गुगल शीट्स (बीटा) साठी चॅटजीपीटी, ज्याचे OpenAI वर्णन करते ते ChatGPT थेट स्प्रेडशीटमध्ये एम्बेड केलेले सूत्रे आणि स्ट्रक्चर्स वापरून जटिल आर्थिक मॉडेल तयार करण्यासाठी, विश्लेषण करण्यासाठी आणि अद्यतनित करण्यासाठी ज्यावर संघ आधीच अवलंबून आहेत.
या सूटमध्ये नवीन ChatGPT एकत्रीकरण देखील समाविष्ट आहे ज्याचा उद्देश मार्केट, कंपनी आणि अंतर्गत डेटा एकाच वर्कफ्लोमध्ये एकत्रित करणे, नामकरण फॅक्टसेट, एमएससीआय, थर्ड ब्रिज आणि मूडीज.
कमाईचे पूर्वावलोकन, तुलनात्मक विश्लेषण, सवलतीच्या रोख प्रवाह विश्लेषण आणि गुंतवणूक मेमोचा मसुदा तयार करणे यासारख्या पुनरावृत्ती होणाऱ्या आर्थिक कामांसाठी ते पुन्हा वापरता येण्याजोगे “कौशल्य” ऑफर करते.
ओपनएआय अंतर्गत बेंचमार्क दाव्यासह आर्थिक पुश पूर्ण करते: मॉडेल कामगिरी GPT-5 सह 43.7% वरून GPT-5.4 सह 88.0% पर्यंत वाढली आहे. OpenAI च्या अंतर्गत गुंतवणूक बँकिंग बेंचमार्कचा विचार करणे.
व्यावसायिक कामाच्या विरूद्ध एआय कामगिरीचे बेंचमार्किंग
OpenAI बेंचमार्कवर आधारित आहे ज्याचे उद्दिष्ट केवळ कोडे सोडवणे नव्हे तर वास्तविक ऑफिस आउटपुटसारखे असणे आहे. GDPval (GDPval) मध्ये, एक मूल्यांकन ज्यामध्ये 44 व्यवसायांमध्ये “सु-परिभाषित ज्ञान कार्य” समाविष्ट आहे, OpenAI अहवाल देते की GPT-5.4 83.0% तुलनेत उद्योग व्यावसायिकांशी जुळते किंवा त्यापेक्षा जास्त आहे, GPT-5.2 साठी 71.0% च्या तुलनेत.
कंपनी आर्टवर्कच्या प्रकारांमध्ये विशिष्ट सुधारणा देखील हायलाइट करते जे मॉडेलमधील कमकुवतपणा प्रकट करतात: संरचित तक्ते, सूत्रे, वर्णनात्मक सुसंगतता आणि डिझाइन गुणवत्ता.
कनिष्ठ गुंतवणूक बँकिंग विश्लेषक काय करू शकतो यानुसार तयार केलेल्या स्प्रेडशीट मॉडेलिंग कार्यांच्या अंतर्गत बेंचमार्कमध्ये, GPT-5.4 ची सरासरी स्कोअर 87.5% आहे, जीपीटी-5.2 साठी 68.4% आहे.
प्रेझेंटेशन रेटिंग प्रॉम्प्टच्या एका संचामध्ये, OpenAI म्हणते की मानवी रेटर्सनी GPT-5.2 सादरीकरणांपेक्षा 68.0% वेळा GPT-5.4 सादरीकरणांना प्राधान्य दिले, मजबूत सौंदर्यशास्त्र, अधिक दृश्य विविधता आणि प्रतिमा निर्मितीचा अधिक कार्यक्षम वापर यांचा हवाला देऊन.
विश्वासार्हता सुधारा आणि भ्रम कमी करा
OpenAI ने GPT-5.4 चे आजपर्यंतचे सर्वात वास्तववादी मॉडेल म्हणून वर्णन केले आहे आणि या दाव्याला व्यावहारिक डेटा सेटशी जोडले आहे: अचिन्हांकित दावे जेथे वापरकर्त्यांनी यापूर्वी तथ्यात्मक त्रुटी फ्लॅग केल्या आहेत. या गटात OpenAI ने GPT-5.4 नोंदवले वैयक्तिक दावे ते खोटे बोलण्याची शक्यता 33% कमी आहे पूर्ण प्रतिसाद GPT-5.2 पेक्षा कोणत्याही त्रुटी असण्याची शक्यता 18% कमी आहे.
OpenAI च्या VentureBeat ला प्रदान केलेल्या स्टेटमेंटमध्ये आणि सुरुवातीच्या GPT-5.4 परीक्षकांना श्रेय दिलेले, Walleye Capital चे Daniel Swiecki म्हणतात की अंतर्गत वित्त आणि Excel मूल्यमापनात, GPT-5.4 ने अचूकता 30 टक्के गुणांनी सुधारली आहे, ज्याचा तो मॉडेल अद्यतनांच्या विस्तारित ऑटोमेशन आणि परिस्थितीशी संबंधित आहे.
Mercor चे CEO Brendan Foudy यांनी GPT-5.4 ला कंपनीने प्रयत्न केलेले सर्वोत्कृष्ट मॉडेल म्हटले आहे आणि ते म्हणतात की ते आता व्यावसायिक सेवा व्यवसायांसाठी Mercor च्या APEX-Agents मानकांवर आघाडी घेत आहे, स्लाईड डेक, आर्थिक मॉडेल्स आणि कायदेशीर विश्लेषण यासारख्या दीर्घकालीन वितरणावर लक्ष केंद्रित करून.
किंमत आणि उपलब्धता
API मध्ये, OpenAI म्हणते की GPT-5.4 थिंकिंग उपलब्ध आहे gpt-5.4 आणि GPT-5.4 प्रो सारखे gpt-5.4-pro. किंमत खालीलप्रमाणे आहे:
-
GPT-5.4: $2.50/1 दशलक्ष एंट्री टोकन; आउटपुटसाठी $15/1M टोकन
-
GPT-5.4 Pro: $30/दशलक्ष इनपुट टोकन; $180/दशलक्ष आउटपुट टोकन
-
बूस्ट + फ्लेक्स: अर्धा दर; प्राधान्य प्रक्रिया: 2 x दर
हे खालील सारणीमध्ये दर्शविल्याप्रमाणे, संपूर्ण उद्योगाच्या तुलनेत API द्वारे चालविण्यासाठी सर्वात महाग मॉडेलपैकी GPT-5.4 बनवते.
|
मॉडेल |
प्रवेशद्वार |
आउटपुट |
एकूण खर्च |
स्रोत |
|
राणी 3 टर्बो |
$०.०५ |
$0.20 |
$०.२५ |
अलीबाबा मेघ |
|
Qwen3.5-फ्लॅश |
$०.१० |
$0.40 |
$0.50 |
अलीबाबा मेघ |
|
डीप चॅट (V3.2-Exp) |
$0.28 |
$०.४२ |
$०.७० |
खोल आजारी |
|
कारण सखोल शोध (V3.2-Exp) |
$0.28 |
$०.४२ |
$०.७० |
खोल आजारी |
|
GROC 4.1 फास्ट (हेरिस्टिक) |
$0.20 |
$0.50 |
$०.७० |
xAI |
|
Grok 4.1 वेगवान आहे (मूर्खपणा) |
$0.20 |
$0.50 |
$०.७० |
xAI |
|
मिनी कमाल M2.5 |
$०.१५ |
$1.20 |
$१.३५ |
मिनी कमाल |
|
मिथुन 3.1 फ्लॅश लाइट |
$०.२५ |
$1.50 |
$१.७५ |
|
|
मिनी कमाल M2.5-विद्युल्लता |
$0.30 |
$2.40 |
$2.70 |
मिनी कमाल |
|
मिथुन 3 फ्लॅश पूर्वावलोकन |
$0.50 |
$3.00 |
$3.50 |
|
|
किमी-के२.५ |
$0.60 |
$3.00 |
$3.60 |
मूनशॉट |
|
GLM-5 |
$1.00 |
$3.20 |
$४.२० |
Z.ai |
|
एर्नी 5.0 |
$०.८५ |
$३.४० |
$४.२५ |
बायडू |
|
क्लॉड हायकू 4.5 |
$1.00 |
$५.०० |
$6.00 |
मानववंशीय |
|
नाणे ३ कमाल (०१/२३/२०२६) |
$1.20 |
$6.00 |
$७.२० |
अलीबाबा मेघ |
|
मिथुन 3 प्रो (≥200K) |
$2.00 |
$१२.०० |
$१४.०० |
|
|
GPT-5.2 |
$१.७५ |
$१४.०० |
$१५.७५ |
OpenAI |
|
क्लॉड सॉनेट 4.6 |
$3.00 |
$१५.०० |
$18.00 |
मानववंशीय |
|
GPT-5.4 |
$2.50 |
$१५.०० |
$१७.५० |
OpenAI |
|
मिथुन 3 प्रो (>200k) |
$४.०० |
$18.00 |
$२२.०० |
|
|
व्यवसाय बंद करणे 4.6 |
$५.०० |
$२५.०० |
$३०.०० |
मानववंशीय |
|
GPT-5.2 प्रो |
$21.00 |
$168.00 |
$१८९.०० |
OpenAI |
|
GPT-5.4 प्रो |
$३०.०० |
$180.00 |
$210.00 |
OpenAI |
आणखी एक महत्त्वाची सूचना: GPT-5.4 सह, 272,000 इनपुट वर्णांपेक्षा जास्त विनंत्या सामान्य दराच्या दुप्पट दराने बिल केल्या जातात, जे पूर्वी समर्थित फॉर्मपेक्षा मोठे दावे सबमिट करण्याची क्षमता दर्शविते.
कोडेक्समध्ये, डीफॉल्ट कॉम्प्रेशन 272K टोकन आहे आणि इनपुट 272K पेक्षा जास्त असेल तेव्हाच उच्च दीर्घ संदर्भ किंमत लागू होते – याचा अर्थ विकासक उच्च दर ट्रिगर न करता त्या आकारावर किंवा त्यापेक्षा कमी दावे सबमिट करणे सुरू ठेवू शकतात, परंतु ते कम्प्रेशन थ्रेशोल्ड वाढवून मोठ्या दाव्यांची निवड रद्द करू शकतात, फक्त मोठ्या विनंतीसाठी जारी केलेल्या मोठ्या विनंतीसह.
ओपनएआयच्या प्रवक्त्याने सांगितले की API चे कमाल थ्रूपुट 128,000 टोकन आहे, जे मागील मॉडेल्ससारखेच आहे.
शेवटी, बेसलाइनवर GPT-5.4 ची किंमत जास्त का होती यावर, प्रवक्त्याने याचे श्रेय तीन घटकांना दिले: जटिल कार्यांसाठी उच्च क्षमता (प्रोग्रामिंग, संगणक वापर, सखोल शोध, प्रगत दस्तऐवज निर्मिती आणि साधन वापरासह), OpenAI रोडमॅपमधील महत्त्वपूर्ण संशोधन सुधारणा आणि समान कार्यांसाठी कमी टोकन वापरणारे अधिक कार्यक्षम निष्कर्ष. वाढीसह देखील किंमतीमध्ये मॉडेल.
व्यापक परिवर्तन
रिलीझ आणि फॉलो-अप स्पष्टीकरणांद्वारे, GPT-5.4 ला एक मॉडेल म्हणून स्थान देण्यात आले आहे ज्याचे उद्दिष्ट “उत्तरे निर्माण करण्या” च्या पलीकडे जाणे आणि टिकाऊ व्यावसायिक कार्यप्रवाहांमध्ये – ज्यासाठी साधन समन्वय, संगणक परस्परसंवाद, दीर्घ-स्वरूप संदर्भ आणि आउटपुट आवश्यक आहे जे लोक प्रत्यक्ष कामावर वापरत असलेल्या कलाकृतींसारखे दिसतात.
टोकन कार्यक्षमता, टूल शोधणे, मूळ संगणक वापरणे आणि वास्तविक-जगातील वापरकर्त्याने सादर केलेल्या त्रुटी कमी करणे यावर OpenAI चा फोकस सर्व एकाच दिशेने निर्देशित करतात: पुन्हा प्रयत्नांची किंमत कमी करून एजंटेड सिस्टमला उत्पादनात अधिक व्यवहार्य बनवणे — पुन्हा प्रयत्न हा मानवी पुन:प्रयत्न असो, एजंट दुसऱ्या साधनाला कॉल करणारा असो किंवा वर्कफ्लो रीस्टार्ट करा कारण पहिला पास झाला.
















