शांघायमध्ये मुख्यालय असलेल्या चीनी AI स्टार्टअप MiniMax ने आज AI उद्योगात दोन वेगवेगळ्या आवृत्त्यांमध्ये नवीन M2.5 भाषेचे मॉडेल रिलीज करून धक्का दिला, जे अत्याधुनिक AI इतके स्वस्त बनवण्याचे वचन देते जेणेकरून तुम्ही बिलाची चिंता करणे पूर्णपणे थांबवू शकता.
असेही सांगितले जाते "मुक्त स्रोत," जरी वजन (सेटिंग्ज) आणि कोड अद्याप प्रकाशित केले गेले नाहीत किंवा परवाना प्रकार किंवा अचूक अटी नाहीत. परंतु MiniMax सेवा स्वतःच्या API आणि भागीदारांच्या द्वारे किती महाग आहे हे लक्षात घेण्यासारखे नाही.
गेल्या काही वर्षांमध्ये, जगातील सर्वात शक्तिशाली AI वापरणे म्हणजे एखाद्या महागड्या सल्लागाराची नियुक्ती करण्यासारखे होते — ते खूप चांगले होते, परंतु तुम्ही सतत घड्याळ (आणि टिकणारी संख्या) पाहत असता. M2.5 ते गणित बदलते, सीमा खर्च 95% पर्यंत कमी करा.
Google आणि Anthropic मधील उच्च-अंत मॉडेलला प्रतिस्पर्ध्याचे कार्यप्रदर्शन प्रदान करणे, विशेषत: एंटरप्राइझ कार्यांसाठी प्रॉक्सी वापरणे, यासह मायक्रोसॉफ्ट वर्ड, एक्सेल आणि पॉवरपॉइंट फाइल्स तयार कराMiniMax सट्टेबाजी करत आहे की भविष्य हे केवळ मॉडेल किती स्मार्ट आहे यावर अवलंबून नाही, तर ते किती वेळा वापरणे तुम्हाला परवडेल यावर अवलंबून आहे.
किंबहुना, हे उद्दिष्ट साध्य करण्यात ते यशस्वी झाल्याचे मिनीमॅक्सचे म्हणणे आहे "वित्त, कायदा आणि सामाजिक विज्ञान यासारख्या क्षेत्रातील अग्रगण्य व्यावसायिकांसह" मॉडेल त्याच्या वैशिष्ट्यांनुसार आणि मानकांनुसार वास्तविक कार्य करू शकते याची खात्री करण्यासाठी.
हे प्रकाशन महत्त्वाचे आहे कारण ते कृत्रिम बुद्धिमत्तेपासून बदल म्हणून चिन्हांकित करते… "चॅटबॉट" कृत्रिम बुद्धिमत्ता म्हणून "घटक". जेव्हा बुद्धी होते "मोजण्यासाठी खूप स्वस्त," विकसक साधी प्रश्नोत्तर साधने तयार करणे थांबवतात आणि बिल्डिंग सुरू करतात "एजंट"- एक प्रोग्राम जो बँक खंडित न करता स्वतंत्रपणे प्रोग्रामिंग, संशोधन आणि जटिल प्रकल्प आयोजित करण्यासाठी तास घालवू शकतो.
खरं तर, MiniMax ने हे मॉडेल आधीच स्वतःच्या ऑपरेशन्समध्ये तैनात केले आहे. सध्या, MiniMax मुख्यालयातील सर्व कार्यांपैकी 30% कामे M2.5 द्वारे पूर्ण केली जातातआणि आश्चर्यकारक M2.5 सह 80% नवीन वचनबद्ध कोड व्युत्पन्न झाला!
MiniMax टीमने त्यांच्या प्रकाशन ब्लॉग पोस्टमध्ये लिहिल्याप्रमाणे, "आमचा विश्वास आहे की M2.5 अर्थव्यवस्थेतील घटकांच्या विकासासाठी आणि ऑपरेशनसाठी जवळजवळ अमर्याद शक्यता प्रदान करते."
तंत्रज्ञान: विखुरलेली ऊर्जा आणि CISPO प्रवेश
M2.5 च्या कार्यक्षमतेचे रहस्य त्याच्या मिक्स ऑफ एक्सपर्ट्स (MoE) आर्किटेक्चरमध्ये आहे. व्युत्पन्न केलेल्या प्रत्येक शब्दासाठी सर्व 230 अब्ज पॅरामीटर्स चालवण्याऐवजी, फक्त मॉडेल "उर्जा देते" 10 अब्ज. हे एका मोठ्या मॉडेलच्या चपळतेसह हलताना मोठ्या मॉडेलची अनुमानित खोली राखण्यास अनुमती देते.
या जटिल प्रणालीला प्रशिक्षित करण्यासाठी, MiniMax ने फोर्ज नावाचे प्रोप्रायटरी रीइन्फोर्समेंट लर्निंग (RL) फ्रेमवर्क विकसित केले आहे. MiniMax अभियंता ऑलिव्ह सॉन्ग यांनी ThursdAI YouTube पॉडकास्टवर सांगितले की हे तंत्र तुलनेने कमी प्रमाणात पॅरामीटर्स वापरत असतानाही कामगिरी मोजण्यासाठी उपयुक्त ठरले आणि मॉडेलला दोन महिन्यांच्या कालावधीत प्रशिक्षण देण्यात आले.
फोर्ज मॉडेलला त्यातून शिकण्यास मदत करण्यासाठी डिझाइन केले आहे "वास्तविक जगाचे वातावरण" – AI ला प्रोग्रामिंगचा सराव करण्यास आणि हजारो सिम्युलेटेड वर्कस्पेसमध्ये टूल्स वापरण्याची परवानगी देणे.
"आमच्या लक्षात आले की यासारख्या छोट्या मॉडेलमध्ये भरपूर क्षमता आहे, जर आपण मोठ्या संख्येने वातावरण आणि एजंट्ससह त्यावर मजबुतीकरण शिक्षण प्रशिक्षित केले," गाणे म्हणाले. "पण ते करणे फार सोपे नाही," जोडून हाच खर्च केला "बराच वेळ" माझ्यावर
या तीव्र प्रशिक्षणादरम्यान मॉडेल स्थिर ठेवण्यासाठी, त्यांनी CISPO (इम्पॉर्टन्स सॅम्पलिंग पॉलिसी ऑप्टिमायझेशन) नावाचा गणितीय दृष्टिकोन वापरला आणि त्यांच्या ब्लॉगवर सूत्र सामायिक केले.
हे फॉर्म्युला हे सुनिश्चित करते की प्रशिक्षणादरम्यान मॉडेलला जास्त दुरुस्त केले जाणार नाही, ज्यामुळे त्याला मिनीमॅक्स म्हणतात ते विकसित होऊ शकते. "आर्किटेक्टची मानसिकता". थेट कोड लिहिण्याऐवजी, M2.5 ने प्रथम प्रकल्पाची रचना, वैशिष्ट्ये आणि इंटरफेसची सक्रियपणे योजना करायला शिकले.
नवीनतम (आणि जवळ) मानके.
या आर्किटेक्चरचे परिणाम नवीनतम उद्योग लीडरबोर्डमध्ये दिसून येतात. M2.5 फक्त सुधारला नाही; ते क्रिप्टो मॉडेल्सच्या शीर्ष स्तरावर उडी मारली आहे, अँथ्रोपिकच्या नवीनतम मॉडेल, क्लॉड ओपस 4.6 च्या अगदी जवळ येत आहे, जे फक्त एका आठवड्यापूर्वी रिलीज झाले होते आणि हे दर्शवते की चीनी कंपन्या आता चांगल्या-संसाधित (GPU च्या संदर्भात) यूएस लॅब्सशी संपर्क साधण्यापासून काही दिवस दूर आहेत.
नवीन MiniMax M2.5 च्या चाचणीचे काही ठळक मुद्दे येथे आहेत:
-
SWE सीट सत्यापित: 80.2% – क्लाउड ओपस 4.6 च्या गतीशी जुळते
-
कंपन्या ब्राउझ करा: 76.3% – उद्योग-अग्रणी संशोधन आणि साधनांचा वापर.
-
मल्टी सीट SWE: 51.3% – बहुभाषिक कोडिंगमध्ये SOTA
-
BFCL (टूल कॉल): 76.8% — अत्यंत अचूक एजंट वर्कफ्लो.
ThursdAI पॉडकास्टवर, होस्ट ॲलेक्स व्होल्कोव्ह यांनी निदर्शनास आणले की MiniMax M2.5 अतिशय वेगाने चालते आणि त्यामुळे क्लॉड ओपस 4.6 साठी $3.00 च्या तुलनेत प्रति टास्क $0.15 दराने कार्य पूर्ण करण्यासाठी कमी टोकन वापरतात.
खर्चाचा अडथळा तोडणे
MiniMax त्याच्या API द्वारे मॉडेलच्या दोन आवृत्त्या ऑफर करते, दोन्ही उच्च-वॉल्यूम उत्पादन वापरावर केंद्रित आहे:
-
M2.5-विद्युल्लता: गतीसाठी ऑप्टिमाइझ केलेले, प्रति सेकंद 100 चिन्हे देत आहेत. त्याची किंमत प्रति दशलक्ष इनपुट कोडसाठी $0.30 आणि प्रति दशलक्ष आउटपुट कोडसाठी $2.40 आहे.
-
M2.5 मानक: किंमत ऑप्टिमाइझ केलेली, प्रति सेकंद 50 वर्णांवर चालते. त्याची किंमत लाइटनिंग आवृत्तीच्या निम्मी आहे ($0.15 प्रति दशलक्ष इनपुट टोकन / $1.20 प्रति दशलक्ष आउटपुट टोकन).
साध्या भाषेत: MiniMax दावा करतो की तुम्ही चार पॉवर करू शकता "एजंट" (AI कामगार) संपूर्ण वर्षासाठी अंदाजे $10,000 साठी सतत.
एंटरप्राइझ वापरकर्त्यांसाठी, ही किंमत GPT-5 किंवा Claude 4.6 Opus सारख्या प्रतिस्पर्धी मालकीच्या मॉडेलच्या किंमतीच्या अंदाजे 1/10 ते 1/20 आहे.
|
मॉडेल |
प्रवेशद्वार |
आउटपुट |
एकूण खर्च |
स्रोत |
|
राणी 3 टर्बो |
$०.०५ |
$0.20 |
$०.२५ |
अलीबाबा मेघ |
|
डीप चॅट (V3.2-Exp) |
$0.28 |
$०.४२ |
$0.70 |
खोल आजारी |
|
कारण सखोल शोध (V3.2-Exp) |
$0.28 |
$०.४२ |
$0.70 |
खोल आजारी |
|
GROC 4.1 फास्ट (हेरिस्टिक) |
$0.20 |
$0.50 |
$0.70 |
xAI |
|
Grok 4.1 वेगवान आहे (मूर्खपणा) |
$0.20 |
$0.50 |
$0.70 |
xAI |
|
मिनी कमाल M2.5 |
$०.१५ |
$1.20 |
$१.३५ |
मिनी कमाल |
|
मिनी कमाल M2.5-लाइटनिंग |
$0.30 |
$2.40 |
$2.70 |
मिनी कमाल |
|
मिथुन 3 फ्लॅश पूर्वावलोकन |
$0.50 |
$3.00 |
$3.50 |
|
|
किमी-के२.५ |
$0.60 |
$3.00 |
$3.60 |
मूनशॉट |
|
GLM-5 |
$1.00 |
$3.20 |
$४.२० |
Z.ai |
|
एर्नी 5.0 |
$०.८५ |
$3.40 |
$४.२५ |
बायडू |
|
क्लॉड हायकू 4.5 |
$1.00 |
$५.०० |
$6.00 |
मानववंशीय |
|
नाणे ३ कमाल (०१/२३/२०२६) |
$1.20 |
$6.00 |
$७.२० |
अलीबाबा मेघ |
|
मिथुन 3 प्रो (≥200K) |
$2.00 |
$१२.०० |
$१४.०० |
|
|
GPT-5.2 |
$१.७५ |
$१४.०० |
$१५.७५ |
OpenAI |
|
क्लॉड सॉनेट 4.5 |
$3.00 |
$१५.०० |
$18.00 |
मानववंशीय |
|
मिथुन 3 प्रो (>200k) |
$४.०० |
$18.00 |
$२२.०० |
|
|
व्यवसाय बंद करणे 4.6 |
$५.०० |
$२५.०० |
$३०.०० |
मानववंशीय |
|
GPT-5.2 प्रो |
$21.00 |
$168.00 |
$१८९.०० |
OpenAI |
कंपन्या आणि नेत्यांसाठी धोरणात्मक परिणाम
तांत्रिक नेत्यांसाठी, M2.5 हे स्वस्त API पेक्षा अधिक प्रतिनिधित्व करते. हे आज संस्थांसाठी ऑपरेशनल गेम बदलत आहे.
साठी दबाव "सुधारण्यासाठी" पैसे वाचवण्याची मागणी गेली. तुम्ही आता उच्च-संदर्भ आणि उच्च-तार्किक मॉडेल्स नियोजित करू शकता नियमित कार्यांसाठी जी पूर्वी प्रतिबंधात्मकपणे महाग होती.
सर्वसमावेशक कार्ये पूर्ण करण्याच्या गतीमध्ये 37% सुधारणा म्हणजे "एजंट" AI ऑर्केस्ट्रेटर्स ज्या पाइपलाइनला महत्त्व देतात — जिथे मॉडेल इतर मॉडेलशी बोलतात — शेवटी रिअल-टाइम वापरकर्ता अनुप्रयोगांसाठी पुरेशा वेगाने पुढे जात आहेत.
याव्यतिरिक्त, M2.5 चे वित्तीय मॉडेलिंगमधील उच्च स्कोअर (MEWC मध्ये 74.4%) हाताळण्याची त्याची क्षमता दर्शवितात "मौखिक ज्ञान" किमान देखरेखीसह कायदा आणि वित्त यांसारखे विशेष उद्योग.
M2.5 हे ओपन सोर्स मॉडेल म्हणून स्थीत असल्यामुळे, संस्था डेटा गोपनीयतेवर अधिक चांगले नियंत्रण ठेवत असताना, मोठ्या प्रमाणात मानवी हस्तक्षेपाशिवाय पूर्वी अशक्य असलेल्या स्केलवर व्यापक, स्वयंचलित कोड ऑडिट करू शकतात, परंतु परवाना अटी आणि वजन प्रकाशित होईपर्यंत, हे फक्त एक मॉनीकरच राहते.
MiniMax M2.5 हा एक सिग्नल आहे की AI ची सीमा आता फक्त सर्वात मोठा मेंदू कोण तयार करू शकते यावर नाही, तर तो मेंदू सर्वात उपयुक्त — आणि परवडणारा — खोलीत काम करणारा कोण बनवू शकतो.
















