गेल्या वर्षीच्या अखेरीस, Google ने जेमिनी 3 प्रो लाँच करून जगातील सर्वात शक्तिशाली AI मॉडेलचे शीर्षक पटकावले — केवळ OpenAI आणि Anthropic ने नवीन मॉडेल्स लाँच करून काही आठवड्यांत मागे टाकले, ही अत्यंत स्पर्धात्मक AI शर्यतीत एक सामान्य घटना आहे.

आता या फ्लॅगशिप मॉडेलच्या अद्ययावत आवृत्तीसह सिंहासनावर पुन्हा हक्क मिळवण्यासाठी Google परत आले आहे: जेमिनी 3.1 प्रो, ज्या कार्यांसाठी साधी प्रतिक्रिया पुरेशी नाही अशा कार्यांसाठी एक स्मार्ट बेसलाइन म्हणून स्थित आहे – विज्ञान, संशोधन आणि अभियांत्रिकी मधील कार्यप्रवाहांना लक्ष्य करणे ज्यासाठी सखोल नियोजन आणि ट्यूनिंग आवश्यक आहे.

खरंच, तृतीय-पक्षाच्या कृत्रिम विश्लेषण फर्मने केलेल्या मूल्यमापनातून असे दिसून आले आहे की Google Gemini 3.1 Pro ने पॅकच्या अग्रभागी उडी घेतली आहे आणि पुन्हा एकदा जगातील सर्वात शक्तिशाली आणि कामगिरी करणारे AI मॉडेल बनले आहे.

मूलभूत तर्कशास्त्रात मोठी झेप

जेमिनी 3.1 प्रो ची सर्वात लक्षणीय प्रगती त्याच्या कठोर तार्किक मानकांविरुद्धच्या कामगिरीमध्ये आहे. उल्लेखनीय म्हणजे, मॉडेलने ARC-AGI-2 मध्ये 77.1% प्रमाणीकृत गुण प्राप्त केले.

हा विशिष्ट निकष मॉडेलच्या प्रशिक्षणादरम्यान न आलेल्या पूर्णपणे नवीन तार्किक नमुन्यांचे निराकरण करण्याच्या क्षमतेचे मूल्यांकन करण्यासाठी डिझाइन केले आहे.

हा निकाल मागील जेमिनी 3 प्रो मॉडेलच्या तार्किक कामगिरीच्या दुप्पट पेक्षा जास्त प्रतिनिधित्व करतो.

अमूर्त तर्कशास्त्राच्या पलीकडे, अंतर्गत बेंचमार्क असे सूचित करतात की 3.1 प्रो कोनाड्यांमध्ये अत्यंत स्पर्धात्मक आहे:

  • वैज्ञानिक ज्ञान: त्याला GPQA डायमंडवर 94.3% गुण मिळाले आहेत.

  • कोडिंग: ते LiveCodeBench Pro वर 2887 च्या Elo वर पोहोचले आणि SWE-Bench Verified वर 80.6% गुण मिळवले.

  • बहुविध समज: याने MMMLU वर 92.6% मिळवले.

हे तांत्रिक नफा केवळ एकत्रित नाहीत; ते मॉडेल कसे हाताळतात यामधील सुधारणा दर्शवतात "विचार करत आहे" टोकन आणि कार्ये दीर्घकाळ चालणारी आहेत, स्वतंत्र एजंट तयार करणाऱ्या विकासकांना अधिक विश्वासार्ह पाया प्रदान करतात.

सुधारित बायोकोडिंग आणि 3D संश्लेषण

Google द्वारे फॉर्मची उपयुक्तता प्रदर्शित करते "उपयोजित बुद्धिमत्ता"- चॅट इंटरफेसवरून फंक्शनल डिलिव्हरेबल्सवर फोकस हलवणे.

सर्वात लक्षणीय वैशिष्ट्यांपैकी एक म्हणजे मॉडेलची जनरेटिव्ह क्षमता "दोलायमान" थेट मजकूर प्रॉम्प्टवरून ॲनिमेटेड SVG प्रतिमा. कारण ते पिक्सेल-आधारित ऐवजी कोड-आधारित आहे, ते स्केलेबल राहते, पारंपारिक व्हिडिओच्या तुलनेत लहान फाइल आकार राखते आणि वेबसाइट्स, सादरीकरणे आणि इतर एंटरप्राइझ अनुप्रयोगांसाठी अधिक तपशीलवार, सादर करण्यायोग्य आणि व्यावसायिक व्हिज्युअल वैशिष्ट्ये आहेत.

ऑफरवरील इतर अनुप्रयोगांमध्ये हे समाविष्ट आहे:

  • जटिल प्रणाली स्थापना: आंतरराष्ट्रीय अंतराळ स्थानकाच्या कक्षेचे चित्रण करणारा थेट स्पेस डॅशबोर्ड तयार करण्यासाठी मॉडेलने सार्वजनिक टेलीमेट्री प्रवाह यशस्वीपणे व्युत्पन्न केला.

  • परस्परसंवादी डिझाइन: एका डेमोमध्ये, 3.1 Pro ने एक जटिल 3D स्टारलिंग मुरमर एन्कोड केला आहे जो वापरकर्ते मॅन्युअल ट्रेसिंगद्वारे हाताळू शकतात, व्युत्पन्न केलेल्या ऑडिओ स्कोअरसह.

  • क्रिएटिव्ह कोडिंग: मॉडेलने एमिली ब्रोंटेच्या वायुमंडलीय थीमचे भाषांतर केले Wuthering हाइट्स आधुनिक, कार्यात्मक वेब डिझाइनमध्ये, ते केवळ शाब्दिक मजकुराच्या ऐवजी टोन आणि शैलीच्या दृष्टीने विचार करण्याची क्षमता दर्शवते.

व्यवसाय प्रभाव आणि समुदाय अभिप्राय

एंटरप्राइझ भागीदारांनी विश्वासार्हता आणि कार्यक्षमतेत लक्षणीय सुधारणा नोंदवून, 3.1 प्रो पूर्वावलोकन रिलीझचे एकत्रीकरण आधीच सुरू केले आहे.

जेटब्रेन्स येथील आर्टिफिशियल इंटेलिजन्सचे संचालक व्लादिस्लाव टँकोव्ह यांनी मागील आवृत्त्यांच्या तुलनेत गुणवत्तेत 15% सुधारणा नोंदवली आणि हे स्पष्ट केले की मॉडेल… "अधिक शक्तिशाली, जलद…अधिक कार्यक्षम आणि कमी आउटपुट कोड आवश्यक आहेत". इतर औद्योगिक प्रतिक्रियांमध्ये हे समाविष्ट आहे:

  • डेटा टेम्पलेट्स: CTO Hanlin Tang ने कळवले की मॉडेल साध्य झाले आहे "त्याच्या वर्गात सर्वोत्तम परिणाम" OfficeQA वर आधारित, सारणीबद्ध आणि असंरचित डेटावर आधारित तर्कासाठी एक मानक.

  • कार्टव्हील: सह-संस्थापक अँड्र्यू कार यांनी मॉडेलवर प्रकाश टाकला "3D परिवर्तन समजून घेण्यात लक्षणीय सुधारणा," 3D ॲनिमेशन पाइपलाइनमधील दीर्घकाळ चाललेल्या रोटेशन ऑर्डर त्रुटींचे निराकरण केल्याचे लक्षात घेऊन.

  • होस्टिंगर प्रॉस्पेक्ट्स: उत्पादन प्रमुख Dainios Kavoliunas लक्षात ठेवा की मॉडेल समजते "कंपन" प्रॉम्प्टच्या मागे, नॉन-डेव्हलपरसाठी शैली-अचूक कोडमध्ये हेतू अनुवादित करणे.

किंमत, परवाना आणि उपलब्धता

विकसकांसाठी, 3.1 प्रो ची सर्वात उल्लेखनीय बाब आहे "डॉलरला तर्क" दर जेमिनी 3 प्रो लाँच केले गेले तेव्हा, ते मानक दाव्यांसाठी $2.00 प्रति दशलक्ष एंट्री टोकनच्या मध्यम-उच्च किंमत श्रेणीमध्ये होते. जेमिनी 3.1 प्रो ही अचूक किंमत संरचना राखून ठेवते, API वापरकर्त्यांना कोणत्याही अतिरिक्त खर्चाशिवाय प्रभावीपणे एक प्रचंड कामगिरी अपग्रेड ऑफर करते.

  • प्रवेश किंमत: 200,000 पर्यंतच्या दाव्यांसाठी प्रति दशलक्ष टोकन $2.00; 200k पेक्षा जास्त दाव्यांसाठी $4.00 प्रति दशलक्ष टोकन.

  • उत्पादन किंमत: 200K पर्यंतच्या दाव्यांसाठी $12.00 प्रति दशलक्ष टोकन; 200k पेक्षा जास्त दाव्यांसाठी $18.00 प्रति दशलक्ष टोकन.

  • संदर्भ कॅशिंग: तुमच्याकडून स्पॉट व्हॉल्यूमवर अवलंबून प्रति दशलक्ष टोकन $0.20 ते $0.40, तसेच प्रति तास प्रति दशलक्ष टोकन $4.50 स्टोरेज शुल्क आकारले जाते.

  • ग्राउंडिंग शोध: दरमहा 5,000 दावे विनामूल्य आहेत, त्यानंतर प्रति 1,000 शोध क्वेरीसाठी $14 फी.

ग्राहकांसाठी, हे मॉडेल जेमिनी आणि नोटबुकएलएममध्ये गुगल एआय प्रो आणि अल्ट्रा सदस्यांसाठी उच्च मर्यादांसह आणले जात आहे.

परवाना परिणाम

Google Cloud आणि Gemini API मधील Vertex Studio द्वारे वितरित केलेले एक मालकीचे मॉडेल म्हणून, 3.1 Pro हे ओपन सोर्स परवान्याऐवजी मानक SaaS (सेवा म्हणून सॉफ्टवेअर) व्यवसाय मॉडेलचे अनुसरण करते.

एंटरप्राइझ वापरकर्त्यांसाठी, हे प्रदान करते… "जमिनीवर तर्क" Vertex AI च्या सुरक्षा परिमितीत, कंपन्यांना त्यांच्या स्वतःच्या डेटावर आत्मविश्वासाने काम करण्याची परवानगी देते.

द "पूर्वावलोकन" स्थिती Google ला सामान्य उपलब्धतेपूर्वी मॉडेलची सुरक्षा आणि कार्यप्रदर्शन सुधारण्यास अनुमती देते, उच्च-जोखीम AI तैनातीमध्ये एक सामान्य सराव आहे.

एआरसी-एजीआय-2 सारख्या मूलभूत तर्कशास्त्र आणि विशेष मानकांवर दुप्पट करून, Google संकेत देत आहे की एआय शर्यतीचा पुढील टप्पा अशा मॉडेल्सद्वारे जिंकला जाईल जे केवळ पुढील शब्दाचा अंदाज न लावता, एखाद्या समस्येबद्दल तर्क करण्यास सक्षम असतील.

Source link