चायनीज कंपनी Moonshot AI ने त्याचे ओपन सोर्स किमी K2 मॉडेल अपडेट केले आहे, ते एजंट स्वॉर्म कोऑर्डिनेशनला सपोर्ट करणाऱ्या आर्किटेक्चरसह कोडिंग आणि व्हिजन मॉडेलमध्ये बदलले आहे.
नवीन मॉडेल, Moonshot Kimi K2.5, ज्या संस्थांना एजंट हवे आहेत जे केंद्रीय निर्णय घेणारे म्हणून फ्रेमवर्क न ठेवता आपोआप कृती करू शकतात.
कंपनीने Kimi K2.5 चे वर्णन “ऑल-इन-वन टेम्प्लेट” असे केले आहे जे व्हिज्युअल आणि टेक्स्टुअल इनपुट दोन्हीला समर्थन देते, ज्यामुळे वापरकर्त्यांना अधिक व्हिज्युअल कोडिंग प्रकल्पांसाठी टेम्पलेटचा फायदा घेता येतो.
मूनशॉटने K2.5 पॅरामीटर्सची संख्या सार्वजनिकरित्या उघड केलेली नाही, परंतु किमी K2 मॉडेलमध्ये 1 ट्रिलियन एकूण पॅरामीटर्स आणि 32 अब्ज सक्रिय पॅरामीटर्स आहेत, त्यांच्या तज्ञांच्या संकरित आर्किटेक्चरमुळे.
हे नवीनतम ओपन सोर्स मॉडेल आहे जे Google, OpenAI आणि Anthropic कडील अधिक बंद पर्यायांना पर्याय देते आणि ते एजंट वर्कफ्लो, स्क्रिप्टिंग आणि दृश्यमानतेसह मुख्य मेट्रिक्समध्ये त्यांना मागे टाकते.
वर मानवतेची शेवटची चाचणी (HLE) मानक, किमीने K2.5 गुण मिळवले ५०.२% (टूल्ससह), OpenAI च्या GPT-5.2 (xhigh) आणि Claude Opus 4.5 ला मागे टाकत आहे. जसे मी साध्य केले ७६.८% वर SWE सीट सत्यापितशीर्ष-स्तरीय एन्कोडिंग मॉडेल म्हणून त्याचे स्थान सिमेंट करत आहे, जरी GPT-5.2 आणि Opus 4.5 याला अनुक्रमे 80 आणि 80.9 वर मागे टाकतात.
Moonshot ने एका प्रेस रीलिझमध्ये म्हटले आहे की, नोव्हेंबरच्या सुरुवातीला रिलीज झालेल्या Kimi K2 आणि Kimi K2 Thinking साठी सप्टेंबर ते नोव्हेंबर दरम्यान वापरकर्त्यांमध्ये 170% वाढ झाली आहे.
एजंट झुंड आणि एकत्रित समन्वय
किमी K2.5 मध्ये तयार केलेल्या स्व-निर्देशित एजंट्स आणि एजंट स्वॉर्म मॉडेलचा फायदा घेण्याचे Moonshot चे उद्दिष्ट आहे. एंटरप्राइझ एआय आणि एजंट-आधारित प्रणालींच्या विकासामध्ये एजंटच्या झुंडीचे पुढील सीमा म्हणून वर्णन केले गेले आहे. गेल्या काही महिन्यांपासून याकडे सर्वांचे लक्ष लागले आहे.
उपक्रमांसाठी, याचा अर्थ असा की त्यांनी Kimi K2.5 सह एजंट इकोसिस्टम तयार केल्यास, ते अधिक कार्यक्षमतेने मापन करण्याची अपेक्षा करू शकतात. परंतु मोठे क्लायंट तयार करण्यासाठी मॉडेल्स वाढवण्याऐवजी किंवा त्यांचे आकार वाढवण्याऐवजी, ते अधिक क्लायंट तयार करण्यावर पैज लावत आहेत जे मुळात स्वत: ला क्युरेट करू शकतात.
Kimi K2.5 “समांतरपणे कार्य करणाऱ्या विशिष्ट एजंट्सचा एक गट तयार आणि समन्वयित करते.” कंपनीने त्याची तुलना मधमाश्याच्या गोळ्याशी केली जिथे प्रत्येक एजंट समान ध्येयासाठी योगदान देत कार्य करतो. मॉडेल 100 सब-एजंटपर्यंत स्वयं-निर्देशित करण्यास शिकते आणि 1,500 टूल कॉल्ससह समांतर वर्कफ्लो कार्यान्वित करू शकते.
“बेंचमार्क फक्त अर्धी गोष्ट सांगतात. मूनशॉट एआयचा असा विश्वास आहे की कृत्रिम सामान्य बुद्धिमत्ता (AGI) वास्तविक-जागतिक वेळेच्या मर्यादांनुसार कार्यक्षमतेने पूर्ण करण्याच्या क्षमतेद्वारे मूल्यमापन केले जावे. त्यांना महत्त्वाची वास्तविक मेट्रिक आहे: AI ने तुम्हाला खरोखर किती वेळ दिला आहे? समांतर कार्यासाठी आवश्यक असलेल्या जटिल कार्यासाठी आवश्यक वेळ कमी होईल. कामाचे दिवस आता काही मिनिटांत पूर्ण होऊ शकतात,” कंपनीने सांगितले.
त्यांच्या ऑर्केस्ट्रेशन रणनीतींबद्दल विचार करणाऱ्या कंपन्या एजंट प्लॅटफॉर्मकडे लक्ष देऊ लागल्या आहेत जिथे एजंट संवाद साधतात आणि कार्ये पार पाडतात, एक कठोर समन्वय फ्रेमवर्क पाळण्याऐवजी जे क्रिया पूर्ण झाल्यावर ठरवते.
किमी K2.5 या प्रकारच्या स्वरूपाचा वापर करू इच्छिणाऱ्या संस्थांसाठी एक आकर्षक पर्याय देऊ शकते, तर काहींना मॉडेलमध्ये तयार केलेले एजंट-आधारित स्वरूप टाळणे आणि त्याऐवजी मॉडेल प्रशिक्षण आणि एजंट असाइनमेंट यांच्यात फरक करण्यासाठी भिन्न व्यासपीठ वापरणे अधिक सोयीस्कर वाटू शकते.
याचे कारण असे की संस्थांना अनेकदा त्यांचे एजंट बनवणाऱ्या मॉडेल्सची व्याख्या करण्यात अधिक लवचिकता हवी असते, त्यामुळे ते एजंट्सची एक इकोसिस्टम तयार करू शकतात जे विशिष्ट कृतींवर सर्वोत्तम काम करणाऱ्या LLM चा फायदा घेतात.
काही एजंट प्लॅटफॉर्म, जसे की सेल्सफोर्स, AWS बेडरॉक आणि IBM, स्वतंत्र निरीक्षण, व्यवस्थापन आणि निरीक्षण साधने प्रदान करतात जे वापरकर्त्यांना वेगवेगळ्या प्रतिमानांसह तयार केलेल्या AI एजंट्सचे आयोजन करण्यात मदत करतात आणि त्यांना एकत्र काम करण्यास सक्षम करतात.
मल्टीमोडल कोडिंग आणि व्हिज्युअल सुधारणा
Kimi K2.5 प्रोग्रामिंगमध्ये देखील उत्कृष्ट आहे आणि “दूरदर्शी प्रोग्रामिंगसाठी आजपर्यंतचे सर्वात शक्तिशाली ओपन सोर्स मॉडेल” असल्याचा दावा करते.
टेम्पलेट वापरकर्त्यांना वापरकर्ता इंटरफेस आणि परस्परसंवादांसह व्हिज्युअल लेआउट चिन्हांकित करण्यास अनुमती देते. व्हिज्युअल इनपुटमध्ये एन्कोड केलेली कार्ये समजून घेण्यासाठी ते प्रतिमा आणि व्हिडिओंचा विचार करते. उदाहरणार्थ, K2.5 वेबसाइटच्या व्हिडीओ रेकॉर्डिंगचे कृतीत विश्लेषण करून, व्हिज्युअल संकेतांचे परस्पर लेआउट आणि ॲनिमेशनमध्ये भाषांतर करून वेबसाइटच्या कोडची पुनर्रचना करू शकते.
“इंटरफेस, मांडणी आणि संवाद ज्यांचे भाषेत अचूक वर्णन करणे कठीण आहे ते स्क्रीनशॉट किंवा स्क्रीन रेकॉर्डिंगद्वारे संप्रेषित केले जाऊ शकतात, ज्याचे मॉडेल पूर्णपणे कार्यक्षम वेबसाइट्समध्ये अर्थ लावू शकते आणि बदलू शकते. यामुळे डायनॅमिक प्रोग्रामिंग अनुभवांचा एक नवीन वर्ग सक्षम होतो,” मूनशॉट म्हणाले.
ही क्षमता किमी कोडमध्ये तयार केली आहे, एक नवीन टर्मिनल-आधारित साधन जे VSCode आणि कर्सर सारख्या IDE सह कार्य करते.
ते समर्थन करते "स्वतंत्र ऑप्टिकल सुधारणा," मॉडेल त्याचे आउटपुट दृष्यदृष्ट्या तपासते—जसे की प्रदर्शित वेब पृष्ठ—संदर्भ दस्तऐवजीकरण, आणि मानवी हस्तक्षेपाशिवाय लेआउट शिफ्ट किंवा सौंदर्यविषयक त्रुटी दूर करण्यासाठी कोडची पुनरावृत्ती करते.
इतर मल्टीमीडिया टेम्प्लेट्सच्या विपरीत जे प्रतिमा तयार करू शकतात आणि समजू शकतात, Kimi K2.5 केवळ त्यांच्या पाठीमागील कोडच नाही तर व्हिज्युअल घटक वापरून वेबसाइटसाठी फ्रंट-एंड परस्परसंवाद तयार करू शकते.
API किंमत
Moonshot AI ने प्रमुख यूएस लॅबशी स्पर्धा करण्यासाठी K2.5 API ची किंमत आक्रमकपणे ठेवली आहे, जे मागील K2 Turbo मॉडेलच्या तुलनेत लक्षणीय सवलत देतात.
-
प्रवेशद्वार: $0.60 प्रति दशलक्ष टोकन (a ४७.८% कमी होते).
-
कॅश्ड एंट्री: $0.10 प्रति दशलक्ष टोकन (a 33.3% कमी होते).
-
आउटपुट: $3.00 प्रति दशलक्ष टोकन (a ६२.५% कमी होते).
कॅश्ड इनपुटची कमी किंमत ($0.10 प्रति दशलक्ष टोकन) विशेषतः संबंधित आहे "स्क्वाड्रन एजंट" वैशिष्ट्ये, ज्यांना बऱ्याच उप-एजंट्समध्ये मोठ्या संदर्भ विंडोची देखभाल करणे आणि साधनांचा व्यापक वापर आवश्यक असतो.
सुधारित MIT परवाना
Kimi K2.5 हे मुक्त स्त्रोत असले तरी, ते सुधारित MIT परवान्याअंतर्गत जारी केले जाते ज्यात लक्ष्यीकरण विशिष्ट तरतूद समाविष्ट आहे… "हायपरग्रेडेशन" व्यावसायिक वापरकर्ते.
परवाना सॉफ्टवेअर वापरण्यासाठी, कॉपी करण्यासाठी, सुधारण्यासाठी आणि विकण्यासाठी मानक परवानग्या देतो.
तथापि, त्यात असे नमूद केले आहे की जर सॉफ्टवेअर किंवा कोणतेही व्युत्पन्न कार्य व्यावसायिक उत्पादन किंवा सेवेसाठी वापरले गेले असेल ज्याचे 100 दशलक्ष मासिक सक्रिय वापरकर्ते (MAU) किंवा मासिक कमाई $20 दशलक्षपेक्षा जास्त असेल तर, संस्थेने ठळकपणे प्रदर्शित केले पाहिजे. "जसे K2.5" वापरकर्ता इंटरफेस वर.
ही तरतूद हे सुनिश्चित करते की मॉडेल जरी बहुसंख्य विकसक आणि स्टार्टअप समुदायासाठी विनामूल्य आणि खुले असले तरी, मोठे टेक दिग्गज स्पष्ट विशेषता प्रदान केल्याशिवाय मूनशॉटच्या तंत्रज्ञानाला व्हाइट लेबल देऊ शकत नाहीत.
ते पूर्ण नाही "मुक्त स्रोत" परंतु हे मेटा च्या समान लामा परवाना अटींपेक्षा चांगले आहे "मुक्त स्रोत" मॉडेल फॅमिली, ज्यासाठी 700 दशलक्ष किंवा अधिक मासिक वापरकर्ते असलेल्या कंपन्यांना कंपनीकडून विशेष एंटरप्राइझ परवाना प्राप्त करणे आवश्यक आहे.
आधुनिक एंटरप्राइझ एआय बिल्डर्ससाठी याचा अर्थ काय आहे
आधुनिक AI स्टॅकची व्याख्या करणाऱ्या प्रॅक्टिशनर्ससाठी – तैनाती चक्र ऑप्टिमाइझ करण्यासाठी काम करणाऱ्या LLM निर्णयकर्त्यांपासून ते AI-शक्तीवर चालणारे एजंट आणि स्वयंचलित व्यवसाय प्रक्रिया स्थापित करणाऱ्या AI ऑर्केस्ट्रेशन लीडर्सपर्यंत – Kimi K2.5 हे लीव्हरेजमध्ये मूलभूत बदल दर्शवते.
झुंड समन्वय थेट मॉडेलमध्ये समाविष्ट करून, Moonshot AI प्रभावीपणे या बिल्डर्सना मर्यादित संसाधनांसह कृत्रिम कार्यबल प्रदान करते, ज्यामुळे एकल अभियंता शंभर स्वायत्त उप-एजंट्सना एकाच राउटरप्रमाणे सहजपणे निर्देशित करू शकतो.
हे "स्केल विस्तार" आर्किटेक्चर मर्यादित हेडकाउंटसह जटिल पाइपलाइन संतुलित करण्याच्या डेटा निर्णयकर्त्यांच्या कोंडीला थेट संबोधित करते, तर कमी किंमतीची रचना बजेट-कटिंग लक्झरीपासून उच्च-संदर्भ डेटा प्रोसेसिंगला नियमित कमोडिटीमध्ये बदलते.
शेवटी, K2.5 अशा भविष्याकडे निर्देश करते जिथे अभियांत्रिकी कार्यसंघावर प्राथमिक मर्यादा यापुढे कीबोर्डवरील हातांची संख्या नसून त्याच्या नेत्यांची झुंड तयार करण्याची क्षमता आहे.
















