Google चे नवीनतम AI मॉडेल येथे आहे: Gemini 3.1 Flash-Lite, आणि यावेळी सर्वात मोठ्या सुधारणा किंमत आणि गतीच्या बाबतीत आहेत, विशेषत: यूएस शोध आणि क्लाउड जायंटच्या शक्तिशाली मल्टी-मॉडल लॉजिक क्षमतांचा लाभ घेऊ इच्छिणाऱ्या एंटरप्राइजेस आणि विकासकांसाठी.
जेमिनी 3 मालिकेतील सर्वात किफायतशीर आणि प्रतिसाद देणारे मॉडेल म्हणून याला स्थान देऊन, Google विशेषत: बुद्धिमत्तेसाठी स्केलवर डिझाइन केलेले समाधान ऑफर करते.
हे प्रक्षेपण त्याच्या भावंडाच्या काही आठवड्यांनंतर आले आहे, जेमिनी 3.1 प्रो, फेब्रुवारीमध्ये पदार्पण केले, एक स्तरित धोरण पूर्ण करते जे संस्थांना त्यांच्या पायाभूत सुविधांच्या प्रत्येक स्तरावर बुद्धिमत्ता मोजू देते.
तंत्रज्ञान: यासाठी अनुकूलित "पहिल्या कोडची वेळ"
उच्च-थ्रूपुट AI च्या जगात, वापरकर्ता अनुभव परिभाषित करणारे मेट्रिक बहुतेकदा अचूकता नसते, तर प्रतिसाद वेळ देखील असते. रिअल-टाइम ग्राहक समर्थन, थेट सामग्री नियंत्रण किंवा त्वरित UI निर्मितीसाठी,… "पहिल्या टोकनचे उत्तर देण्याची वेळ" एखादे ॲप टूल किंवा टीममेटसारखे वाटते की नाही याचे हे प्राथमिक सूचक आहे. मॉडेलला प्रतिसाद देण्यास दोन सेकंदांचा अवधी लागल्यास, द्रव परस्परसंवादाचा भ्रम तुटला जाईल.
जेमिनी 3.1 फ्लॅश-लाइट विशेषत: त्या त्वरित अनुभवासाठी डिझाइन केले आहे. अंतर्गत बेंचमार्क आणि तृतीय-पक्ष मूल्यमापनांनुसार, फ्लॅश-लाइट त्याच्या पूर्ववर्ती, जेमिनी 2.5 फ्लॅशला मागे टाकते, पहिल्या टोकनसाठी 2.5X वेगवान वेळेसह. इतकेच काय, यात एकूण आउटपुट गतीमध्ये 45 टक्के वाढ आहे – 249 च्या तुलनेत 363 वर्ण प्रति सेकंद.
गुगल डीपमाइंडचे रिसर्चचे उपाध्यक्ष कोरे कावोग्लू यांनी एक्स पोस्टमध्ये एआयला रिअल-टाइम अनुभवण्यासाठी जटिल अभियांत्रिकीचे अविश्वसनीय प्रमाण म्हणून वर्णन केलेल्या गोष्टींद्वारे ही गती प्राप्त झाली आहे.
कदाचित सर्वात नाविन्यपूर्ण तांत्रिक जोड म्हणजे विचारांच्या स्तरांचा परिचय.
फ्लॅश-लाइट आणि प्रो प्रकारांमध्ये प्रमाणित केलेले हे वैशिष्ट्य, विकासकांना मॉडेलची अनुमान घनता गतिमानपणे समायोजित करण्यास अनुमती देते. साध्या वर्गीकरण कार्यासाठी किंवा उच्च-व्हॉल्यूम भावना विश्लेषणासाठी, मॉडेलला जास्तीत जास्त गती आणि सर्वात कमी किमतीसाठी डायल केले जाऊ शकते.
याउलट, जटिल कोड एक्सप्लोर करण्यासाठी, डॅशबोर्ड तयार करण्यासाठी किंवा सिम्युलेशन तयार करण्यासाठी, तर्क जोडला जाऊ शकतो, ज्यामुळे मॉडेलला पहिला प्रतिसाद जारी करण्यापूर्वी सखोल तर्क आणि तर्क करण्याची परवानगी मिळते.
उत्पादन: लाइटवेट हेवी हिटर मापन
असताना "प्रकाश" प्रत्यय बऱ्याचदा क्षमतेमध्ये महत्त्वपूर्ण बलिदान दर्शवतो आणि कार्यप्रदर्शन डेटा असे मॉडेल सूचित करतो जे मोठ्या प्रणालींवर चांगले प्रवेश करते. जेमिनी 3.1 फ्लॅश-लाइटने Arena.ai लीडरबोर्डवर 1432 चा Elo स्कोअर मिळवला, ज्यामुळे पॅरामीटर्सच्या संख्येत मोठ्या मॉडेल्ससह स्पर्धात्मकपणे ते ठेवले.
मुख्य बेंचमार्क निष्कर्ष विविध ज्ञान क्षेत्रांमध्ये त्याच्या विशेषज्ञ सामर्थ्यांवर प्रकाश टाकतात:
-
वैज्ञानिक ज्ञान: GPQA डायमंडवर 86.9 टक्के.
-
बहुविध समज: MMMU-Pro वर 76.8 टक्के.
-
बहुभाषिक FAQ: MMMLU वर 88.9 टक्के.
-
पॅरामीट्रिक ज्ञान: 43.3 टक्के SimpleQA द्वारे सत्यापित.
-
अमूर्त तर्क: मानवतेच्या शेवटच्या परीक्षेत 16.0 टक्के (पूर्ण गट)
हे मॉडेल विशेषतः आउटपुटच्या संरचित अनुपालनामध्ये पारंगत आहे, एंटरप्राइझ डेव्हलपर ज्यांना वैध JSON, SQL, किंवा UI कोड व्युत्पन्न करण्यासाठी AI ची आवश्यकता आहे त्यांच्यासाठी एक गंभीर आवश्यकता आहे जी डाउनस्ट्रीम सिस्टम खंडित करणार नाही.
LiveCodeBench सारख्या बेंचमार्क्समध्ये, Flash-Lite ने 72.0 टक्के गुण मिळवले, GPT-5 मिनीसह अनेक प्रतिस्पर्ध्यांना त्याच्या वजन वर्गात सर्वोत्तम केले, ज्याने वेगळ्या उपसंचावर 80.4 टक्के गुण मिळवले परंतु गती आणि खर्च कार्यक्षमतेमध्ये लक्षणीय पिछाडीवर आहे.
शिवाय, CharXiv Reasoning (73.2 टक्के) आणि Video-MMMU (84.8 टक्के) मधील त्याची कामगिरी हे दाखवते की त्याची मल्टीमोडल क्षमता जटिल आकृत्यांचे संश्लेषण करण्यासाठी आणि व्हिडिओमधून ज्ञान मिळविण्यासाठी पुरेशी मजबूत आहे.
इंटेलिजन्स पदानुक्रम: फ्लॅश-लाइट वि. ३.१ प्रो
फ्लॅश-लाइटचे मार्केटमधील स्थान समजून घेण्यासाठी, एखाद्याने ते जेमिनी 3.1 प्रो सोबत पाहिले पाहिजे, जो Google ने AI मुकुट पुन्हा मिळवण्यासाठी फेब्रुवारी 2026 च्या मध्यात लॉन्च केला होता. फ्लॅश-लाइट हा मिथुनचा सिस्टम फीडबॅक आहे, तर 3.1 प्रो निःसंशयपणे मेंदू आहे.
प्राथमिक फरक म्हणजे संज्ञानात्मक प्रक्रियेची खोली. जेमिनी 3.1 प्रो ची रचना मागील पिढीची अनुमानित कामगिरी दुप्पट करण्यासाठी केली गेली आहे, ARC-AGI-2 वर 77.1 टक्के प्रमाणित स्कोअर प्राप्त करून – प्रशिक्षणादरम्यान न आलेल्या संपूर्णपणे नवीन लॉजिक पॅटर्न सोडवण्याच्या मॉडेलच्या क्षमतेची चाचणी करण्यासाठी डिझाइन केलेले बेंचमार्क.
फ्लॅश-लाइटमध्ये 86.9 टक्के वैज्ञानिक ज्ञान आहे, तर प्रो मॉडेल त्या मर्यादांना धक्कादायक 94.3 टक्क्यांपर्यंत ढकलते, ज्यामुळे ते सखोल संशोधन आणि उच्च-स्टेक संश्लेषणासाठी सर्वोत्तम पर्याय बनते. या तार्किक अंतरांवर आधारित अनुप्रयोग फोकस देखील मोठ्या प्रमाणात बदलतो.
Gemini 3.1 Pro मध्ये भावना एन्कोड करण्याची, ॲनिमेटेड SVG प्रतिमा आणि थेट मजकूर प्रॉम्प्टवरून जटिल 3D सिम्युलेशन तयार करण्याची क्षमता आहे. उदाहरणार्थ, एका डेमोमध्ये, प्रो ने एक जटिल 3D स्टारलिंग मुरमर एन्कोड केला जो वापरकर्ते मॅन्युअल ट्रेसिंगद्वारे हाताळू शकतात. तो अमूर्त साहित्यिक थीम द्वारे देखील विचार करू शकतो, जसे की एमिली ब्रोंटेच्या वुथरिंग हाइट्सच्या वायुमंडलीय टोनचे कार्यात्मक वेब डिझाइनमध्ये भाषांतर करणे.
याउलट, जेमिनी 3.1 फ्लॅश-लाइट हा उच्च-आवाजाच्या अंमलबजावणीसाठी एक वर्कहॉर्स आहे. हे लाखो दैनंदिन कार्ये हाताळते—अनुवाद, टॅगिंग आणि संयम—ज्यांना ओव्हरलोड केलेल्या मॉडेलच्या प्रचंड संगणकीय ओझेशिवाय सातत्यपूर्ण, पुनरावृत्ती करता येण्याजोग्या परिणामांची आवश्यकता असते.
हे शेकडो उत्पादनांसह वायरफ्रेम त्वरित भरते किंवा 94 टक्के अचूकतेसह इंटेंट रूटिंग आयोजित करते, सुरुवातीच्या परीक्षकांनी नोंदवले.
१/आठवा: फ्लॅगशिप मॉडेलची किंमत, Gemini 3.1 Pro (जे त्याच्या पूर्ववर्ती, Flash-Lite 2.5 पेक्षा स्वस्त आहे)
एंटरप्राइझ तांत्रिक निर्णय निर्मात्यांसाठी, मिथुन 3.1 मालिकेतील सर्वात आकर्षक भाग म्हणजे त्याचे माइंड-टू-डॉलर गुणोत्तर.
गुगलने किंमत ठरवली आहे Gemini 3.1 Flash-Lite ची किंमत $0.25 प्रति दशलक्ष इनपुट टोकन आणि $1.50 प्रति दशलक्ष आउटपुट टोकन आहे.
ही किंमत क्लॉड 4.5 हायकू सारख्या प्रतिस्पर्ध्यांपेक्षा खूपच कमी महाग करते, ज्याची किंमत प्रति दशलक्ष इनपुट आणि $5.00 प्रति दशलक्ष आउटपुट कोड आहे.
जेमिनी 2.5 फ्लॅशच्या तुलनेत, ज्याची किंमत प्रति दशलक्ष एंट्री $0.30 आहे, फ्लॅश-लाइट कार्यप्रदर्शन नफ्यासह खर्चात कपात देते.
जेमिनी 3.1 प्रो – जे 200K पर्यंतच्या दाव्यांसाठी $2.00 प्रति दशलक्ष इनपुट टोकनची किंमत राखते – तुलना केली असता – दुहेरी मॉडेल दृष्टिकोनाचा धोरणात्मक फायदा स्पष्ट होतो. उच्च-संदर्भ वापरामध्ये (प्रति परस्परसंवाद 200,000 पेक्षा जास्त टोकन), फ्लॅश-लाइट प्रत्यक्षात 12x-16x स्वस्त आहे.
|
संरक्षण मंत्रालयतो |
प्रवेशद्वार |
आउटपुट |
एकूण खर्च |
स्रोत |
|
राणी 3 टर्बो |
$०.०५ |
$0.20 |
$०.२५ |
अलीबाबा मेघ |
|
Qwen3.5-फ्लॅश |
$०.१० |
$०.४० |
$0.50 |
अलीबाबा मेघ |
|
डीप चॅट (V3.2-Exp) |
$0.28 |
$०.४२ |
$०.७० |
खोल आजारी |
|
कारण सखोल शोध (V3.2-Exp) |
$0.28 |
$०.४२ |
$०.७० |
खोल आजारी |
|
GROC 4.1 फास्ट (हेरिस्टिक) |
$0.20 |
$0.50 |
$०.७० |
xAI |
|
Grok 4.1 वेगवान आहे (मूर्खपणा) |
$0.20 |
$0.50 |
$०.७० |
xAI |
|
मिनी कमाल M2.5 |
$०.१५ |
$1.20 |
$१.३५ |
मिनी कमाल |
|
मिथुन 3.1 फ्लॅश लाइट |
$०.२५ |
$1.50 |
$१.७५ |
|
|
मिनी कमाल M2.5-विद्युल्लता |
$0.30 |
$2.40 |
$2.70 |
मिनी कमाल |
|
मिथुन 3 फ्लॅश पूर्वावलोकन |
$0.50 |
$3.00 |
$3.50 |
|
|
किमी-के२.५ |
$0.60 |
$3.00 |
$3.60 |
मूनशॉट |
|
GLM-5 |
$1.00 |
$3.20 |
$४.२० |
Z.ai |
|
एर्नी 5.0 |
$०.८५ |
$3.40 |
$४.२५ |
बायडू |
|
क्लॉड हायकू 4.5 |
$1.00 |
$५.०० |
$6.00 |
मानववंशीय |
|
नाणे ३ कमाल (०१/२३/२०२६) |
$1.20 |
$6.00 |
$७.२० |
अलीबाबा मेघ |
|
मिथुन 3 प्रो (≥200K) |
$2.00 |
$१२.०० |
$१४.०० |
|
|
GPT-5.2 |
$१.७५ |
$१४.०० |
$१५.७५ |
OpenAI |
|
क्लॉड सॉनेट 4.5 |
$3.00 |
$१५.०० |
$18.00 |
मानववंशीय |
|
मिथुन 3 प्रो (>200k) |
$४.०० |
$18.00 |
$२२.०० |
|
|
व्यवसाय बंद करणे 4.6 |
$५.०० |
$२५.०० |
$३०.०० |
मानववंशीय |
|
GPT-5.2 प्रो |
$21.00 |
$168.00 |
$१८९.०० |
OpenAI |
कॅस्केड आर्किटेक्चरसह, संस्था प्रारंभिक जटिल नियोजन, आर्किटेक्चरल डिझाइन आणि सखोल तर्कासाठी 3.1 प्रो वापरू शकते, नंतर फ्लॅश-लाइटला उच्च-वारंवारता, पुनरावृत्ती अंमलबजावणी सोपवू शकते.
हे परिवर्तन प्रभावीपणे AI ला महागड्या, प्रायोगिक खर्चाच्या केंद्रातून उपयुक्तता-स्केल संसाधनाकडे हलवते जे क्लाउड बजेट न संपवता प्रत्येक लॉग फाइल, ईमेल आणि ग्राहक चॅटवर चालते.
समुदाय आणि विकसक अभिप्राय
Google भागीदार नेटवर्कचा प्रारंभिक अभिप्राय सूचित करतो की 3.1 मालिका विश्वसनीय स्वायत्ततेसाठी बाजारपेठेतील एक महत्त्वपूर्ण अंतर यशस्वीरित्या भरून काढते.
कार्टव्हीलचे मुख्य शास्त्रज्ञ अँड्र्यू कार यांनी दोन्ही मॉडेल्सची चाचणी घेतली आणि त्यांची अद्वितीय ताकद लक्षात घेतली. 3.1 Pro च्या संदर्भात, याने 3D संक्रमणांबद्दलची खूप सुधारित समज हायलाइट केली आहे, ॲनिमेशन मार्गांमधील दीर्घकाळ रोटेशन ऑर्डर त्रुटींचे निराकरण केले आहे.
तथापि, Flash-Lite हा व्यवसाय उघडण्याचा एक वेगळा प्रकार असल्याचे आढळले आहे: "3.1 फ्लॅश-लाइट हे एक उल्लेखनीय कार्यक्षम मॉडेल आहे. तो अत्यंत वेगवान आहे, परंतु तरीही त्याला सर्व सूचनांचे पालन करण्याचा मार्ग सापडतो… त्याचा IQ ते गती गुणोत्तर इतर कोणत्याही मॉडेलमध्ये अतुलनीय आहे.".
ग्राहकाभिमुख ऍप्लिकेशन्ससाठी, Flash-Lite ची कमी विलंबता ही बाजारपेठ विस्तारण्यासाठी महत्त्वाची होती.
कोल्बी नॉटिंगहॅम, अक्षांश येथील AI चे प्रमुख, म्हणाले की मॉडेलने त्यांच्या मागील मॉडेलच्या तुलनेत 20 टक्के जास्त यश दर आणि 60 टक्के अधिक वेगवान निष्कर्ष काढला आहे, ज्यामुळे अत्याधुनिक कथाकथन अधिक व्यापक प्रेक्षकांसाठी शक्य झाले आहे.
डेटा टॅगिंगमधील विश्वासार्हता देखील एक प्रमुख वैशिष्ट्य म्हणून उदयास आली. Whiring चे CEO Bianca Rangecroft यांनी सांगितले की, त्यांच्या लेबलिंग पाइपलाइनमध्ये 3.1 Flash-Lite समाकलित करून, त्यांनी लेबलिंग आयटममध्ये 100 टक्के सुसंगतता प्राप्त केली आहे, त्यांची लेबले नियुक्त करण्यासाठी एक अत्यंत विश्वासार्ह आधार प्रदान केला आहे आणि संरचित आउटपुटमध्ये आत्मविश्वास वाढवला आहे.
HubX सह-संस्थापक कान ओर्तबास यांनी नमूद केले की, फ्लॅश-लाइट, एक मूलगामी ऑर्केस्ट्रेशन इंजिन म्हणून, जवळपास-तात्काळ प्रवाह आणि 97 टक्के सातत्यपूर्ण आउटपुट अनुपालनासह उप-10-सेकंद पूर्णता प्रदान करते.
मुख्य बाजूने, जेटब्रेन्स येथील AI चे संचालक व्लादिस्लाव टँकोव्ह यांनी प्रो मॉडेलमध्ये 15 टक्के गुणवत्तेची सुधारणा नोंदवली, ती अधिक मजबूत, वेगवान, अधिक कार्यक्षम आहे आणि त्याचे उद्दिष्ट साध्य करण्यासाठी कमी टोकन्सची आवश्यकता आहे यावर जोर दिला.
परवाना आणि संस्था उपलब्धता
Gemini 3.1 Flash-Lite आणि Pro दोन्ही Google AI स्टुडिओ आणि Vertex AI द्वारे वितरित केले जातात. प्रोप्रायटरी मॉडेल म्हणून, ते ओपन सोर्स परवान्याऐवजी मानक व्यावसायिक सॉफ्टवेअर-ए-ए-ए-सेवा मॉडेलचे अनुसरण करतात.
Vertex AI सह पॉवरिंग सुरक्षित परिघात एंटरप्राइझ तर्क प्रदान करते, उच्च-वॉल्यूम वर्कलोड – जसे की OfficeQA मानक अंतर्गत सर्वोत्तम-इन-श्रेणी परिणाम प्राप्त करण्यासाठी डेटाब्रिक्सद्वारे समर्थित – एंटरप्राइझ-ग्रेड सुरक्षा आणि डेटा रेसिडेन्सी सेफगार्ड्ससह संरक्षित राहतील याची खात्री करते.
तथापि, हे सानुकूलतेच्या दृष्टीने देखील मर्यादित आहे आणि अलीबाबाने गेल्या काही आठवड्यांत प्रसिद्ध केलेल्या शक्तिशाली नवीन Qwen3.5 मालिकेसारख्या पूर्णपणे मुक्त-स्रोत स्पर्धकांच्या विपरीत, सतत इंटरनेट कनेक्शन आवश्यक आहे.
फ्लॅश-लाइटची वर्तमान पूर्वावलोकन स्थिती Google ला सामान्य उपलब्धतेपूर्वी वास्तविक-जगातील विकसक अभिप्रायावर आधारित सुरक्षा आणि कार्यप्रदर्शन सुधारण्याची अनुमती देते.
जेमिनी API द्वारे आधीच तयार करत असलेल्या विकसकांसाठी, 3.1 Pro आणि Flash-Lite वर जाणे समान किंवा कमी किमतीच्या बिंदूंवर थेट कार्यप्रदर्शन अपग्रेडचे प्रतिनिधित्व करते, जटिल प्रॉक्सी वर्कफ्लोच्या प्रवेशातील अडथळा प्रभावीपणे कमी करते.
निर्णय: उपयुक्ततावादी AI साठी नवीन मानक
जेमिनी 3.1 फ्लॅश-लाइटचे प्रकाशन Google च्या धोरणात्मक पिव्होटचा अंतिम भाग आहे. उद्योग सर्वात जटिल समस्यांसाठी नवीनतम तार्किक पध्दतीने वेडलेले असताना, संस्थेच्या बहुतेक कामांमध्ये उच्च-आवाज, पुनरावृत्ती परंतु उच्च-सुस्पष्टता कार्ये असतात.
Gemini 3.1 Pro मध्ये दोन्ही मेंदू आणि Gemini 3.1 Flash-Lite मध्ये अभिप्राय प्रदान करून, Google संकेत देत आहे की AI शर्यतीचा पुढचा टप्पा अशा मॉडेल्सद्वारे जिंकला जाईल जे एखाद्या समस्येबद्दल विचार करू शकतील, परंतु त्या समाधानाची मोठ्या प्रमाणावर अंमलबजावणी देखील करू शकतील.
2026 उत्पादन रोडमॅपमध्ये कोणते मॉडेल समाकलित करायचे हे ठरवणाऱ्या CTO किंवा तांत्रिक नेत्यासाठी, जेमिनी 3.1 मालिका एक आकर्षक केस बनवते: विश्वासार्ह, तात्काळ परिणाम मिळविण्यासाठी तुम्हाला यापुढे तार्किक कर भरावा लागणार नाही. आज फ्लॅश-लाइटच्या पूर्वावलोकनात, विकासक समुदायासाठी संदेश स्पष्ट आहे: IQ अडथळा केवळ मोठ्या प्रमाणात कमी केला गेला नाही तर तो नष्ट केला गेला आहे.














