चायनीज AI स्टार्टअप Zhupai, ज्याला z.ai म्हणूनही ओळखले जाते, या आठवड्यात लक्षवेधी नवीन मोठ्या भाषेच्या मॉडेलसह परत येत आहे: GLM-5.
z.ai च्या प्रभावी चालू असलेल्या GLM मालिकेतील नवीनतम, ते MIT ओपन सोर्स परवाना राखते – एंटरप्राइझ तैनातीसाठी आदर्श – आणि, अनेक उल्लेखनीय कामगिरींपैकी एक, स्वायत्त AI निर्देशांक v4.0 मध्ये विक्रमी-कमी भ्रम दर प्राप्त करते.
AA-Omniscience Index वर -1 च्या स्कोअरसह – त्याच्या पूर्ववर्तीच्या तुलनेत – 35-पॉइंटच्या मोठ्या प्रमाणात सुधारणा दर्शविते – GLM-5 आता Google, OpenAI आणि Anthropic सारख्या यूएस स्पर्धकांसह संपूर्ण AI उद्योगाला माहिती बनवण्याऐवजी केव्हा टाळायचे हे जाणून विश्वसनीयतेच्या ज्ञानात आघाडीवर आहे.
त्याच्या तर्कशक्तीच्या व्यतिरिक्त, GLM-5 उच्च-उपयुक्त संज्ञानात्मक कार्यासाठी डिझाइन केले आहे. त्यात मूळ वैशिष्ट्ये आहेत "प्रॉक्सी मोड" वापरण्यास-तयार दस्तऐवजांसह, कच्चा दावे किंवा स्त्रोत सामग्री थेट व्यावसायिक कार्यालय दस्तऐवजांमध्ये रूपांतरित करण्याची परवानगी देणारी क्षमता .docx, .pdfआणि .xlsx फाईल्स.
तुम्ही तपशीलवार आर्थिक अहवाल, हायस्कूल प्रायोजकत्व प्रस्ताव किंवा जटिल स्प्रेडशीट तयार करत असलात तरीही, GLM-5 हे वास्तववादी स्वरूपांमध्ये परिणाम प्रदान करते जे थेट संस्थेच्या कार्यप्रवाहात समाकलित होते.
त्याची किंमत देखील सुमारे $0.80 प्रति दशलक्ष इनपुट टोकन आणि $2.56 प्रति दशलक्ष आउटपुट टोकन अशी आहे, क्लॉड ओपस 4.6 सारख्या मालकीच्या प्रतिस्पर्ध्यांपेक्षा जवळजवळ 6x स्वस्त, आधुनिक प्रॉक्सी आर्किटेक्चर पूर्वीपेक्षा अधिक किफायतशीर बनवते. एंटरप्राइझ निर्णय निर्मात्यांना मॉडेल आणि त्याच्या प्रशिक्षणाबद्दल काय माहित असले पाहिजे ते येथे आहे.
तंत्रज्ञान: एजंट कार्यक्षमता वाढवणे
GLM-5 च्या केंद्रस्थानी सुरुवातीच्या पॅरामीटर्समध्ये मोठी उडी आहे. मॉडेल GLM-4.5 साठी 355B पॅरामीटर्सपासून 744B पॅरामीटर्सपर्यंत, मिक्स्चर-ऑफ-एक्सपर्ट्स (MoE) स्ट्रक्चरमध्ये प्रत्येक टोकनसाठी 40B सक्रिय आहे. या वाढीला प्री-ट्रेनिंग डेटा 28.5T टोकन्सपर्यंत वाढवून समर्थित आहे.
या विशालतेच्या प्रशिक्षणातील त्रुटी दूर करण्यासाठी, झाईने विकसित केले "चिखल" एसिंक्रोनस रीइन्फोर्समेंट लर्निंग (RL) साठी नवीन पायाभूत सुविधा.
पारंपारिक आरएल अनेकदा ग्रस्त "लांब शेपूट" अडथळे. स्लीम हे समतोल तोडते मार्ग स्वतंत्रपणे निर्माण करण्यास परवानगी देऊन, जटिल कार्यात्मक वर्तनासाठी आवश्यक असलेल्या अचूक पुनरावृत्तींना अनुमती देऊन.
सक्रिय आंशिक वजाबाकी (एप्रिल) सारख्या सिस्टीम-स्तरीय ऑप्टिमायझेशन्सचा समावेश करून, स्लीम पत्ते अडथळे निर्माण करतात जे सामान्यत: RL प्रशिक्षण वेळेच्या 90% पेक्षा जास्त खर्च करतात, जटिल एजंट कार्यांच्या पुनरावृत्ती चक्राला नाटकीयपणे गती देतात.
फ्रेमवर्कची रचना ट्रिपल मॉड्यूलर प्रणालीभोवती फिरते: Megatron-LM द्वारे समर्थित उच्च-कार्यक्षमता प्रशिक्षण मॉड्यूल, उच्च-थ्रूपुट डेटा व्युत्पन्न करण्यासाठी SGLang आणि समर्पित राउटर वापरणारे बूटस्ट्रॅप मॉड्यूल आणि जलद आरंभीकरण आणि बूट स्टोरेज व्यवस्थापित करणारे केंद्रीय डेटा स्टोअर.
सत्यापित करण्यायोग्य अनुकूली वातावरण आणि बहु-भूमिका एकत्रित फीडबॅक लूप सक्षम करून, Slime AI ला साध्या चॅट परस्परसंवादातून कठोर, दीर्घ-क्षितिज प्रणाली अभियांत्रिकीकडे नेण्यासाठी आवश्यक असलेला मजबूत, उच्च-उत्पादकता पाया प्रदान करते.
तैनाती व्यवस्थापित करण्यासाठी, GLM-5 डीपसीक स्पार्स अटेंशन (DSA) सॉफ्टवेअर समाकलित करते, 200K संदर्भ क्षमता राखून खर्चात लक्षणीय घट करते.
सर्वसमावेशक संज्ञानात्मक कार्य
झाईने GLM-5 फ्रेम केले "कार्यालय" AGI युगासाठी एक साधन. पूर्वीच्या मॉडेल्सनी उतारे वर लक्ष केंद्रित केले असताना, GLM-5 हे वापरण्यास-तयार कागदपत्रे वितरीत करण्यासाठी डिझाइन केलेले आहे.
हे स्वतंत्रपणे दावे .docx, .pdf आणि .xlsx फॉरमॅट केलेल्या फाइल्समध्ये रूपांतरित करू शकते, आर्थिक अहवालांपासून प्रायोजकत्व प्रस्तावांपर्यंत.
सराव मध्ये, याचा अर्थ असा आहे की मॉडेल उच्च-स्तरीय उद्दिष्टे कृती करण्यायोग्य उपकार्यांमध्ये विघटित करू शकतात आणि त्यांची अंमलबजावणी करू शकतात. "एजंट अभियांत्रिकी," AI अंमलबजावणी हाताळते तर मानव गुणवत्तेचे दरवाजे सेट करतात.
उच्च कार्यक्षमता
GLM-5 चे बेंचमार्क हे जगातील सर्वात शक्तिशाली नवीन ओपन सोर्स मॉडेल बनवतात, कृत्रिम विश्लेषणानुसार, दोन आठवड्यांपूर्वी रिलीज झालेल्या चिनी प्रतिस्पर्धी मूनशॉटच्या नवीन Kimi K2.5 मॉडेलला मागे टाकून, हे स्पष्ट करते की चीनी AI कंपन्या अधिक चांगल्या-संसाधन असलेल्या पाश्चात्य स्पर्धकांनी जवळजवळ कोपऱ्यात आहेत.
आज शेअर केलेल्या z.ai च्या स्वतःच्या सामग्रीनुसार, GLM-5 अनेक प्रमुख निकषांवर अत्याधुनिकतेच्या जवळ आहे:
SWE सीट सत्यापित: GLM-5 ने 77.8 चा स्कोअर मिळवला, जेमिनी 3 प्रो (76.2) ला सर्वोत्तम केले आणि क्लॉड ओपस 4.6 (80.9) च्या जवळ आले.
सीट 2 विक्री: बिझनेस मॅनेजमेंट सिम्युलेशनमध्ये, GLM-5 $4,432.12 च्या अंतिम स्कोअरसह ओपन सोर्स मॉडेल्समध्ये प्रथम क्रमांकावर आहे.
कामगिरी बाजूला ठेवून, GLM-5 आक्रमकपणे बाजाराला कमी करत आहे. हे 11 फेब्रुवारी 2026 पर्यंत OpenRouter वर उपलब्ध आहे आणि त्याची किंमत सुमारे $0.80 – $1.00 प्रति दशलक्ष इनपुट टोकन आणि $2.56 – $3.20 प्रति दशलक्ष आउटपुट टोकन आहे. इतर अग्रगण्य एलएलएम प्रोग्रामच्या तुलनेत हे मध्यम श्रेणीत येते, परंतु त्याच्या उच्च दर्जाच्या बेंचमार्क कामगिरीवर आधारित, यालाच कोणी म्हणेल. "तो चोरी करतो."
|
मॉडेल |
इनपुट (प्रति दशलक्ष चिन्हे) |
आउटपुट (प्रति दशलक्ष चिन्हे) |
एकूण खर्च (1 दशलक्ष + 1 दशलक्ष बाहेर) |
स्रोत |
|
राणी 3 टर्बो |
$०.०५ |
$0.20 |
$०.२५ |
अलीबाबा मेघ |
|
GROC 4.1 फास्ट (हेरिस्टिक) |
$0.20 |
$0.50 |
$०.७० |
xAI |
|
Grok 4.1 वेगवान आहे (मूर्खपणा) |
$0.20 |
$0.50 |
$०.७० |
xAI |
|
डीप चॅट (V3.2-Exp) |
$0.28 |
$०.४२ |
$०.७० |
खोल आजारी |
|
कारण सखोल शोध (V3.2-Exp) |
$0.28 |
$०.४२ |
$०.७० |
खोल आजारी |
|
मिथुन 3 फ्लॅश पूर्वावलोकन |
$0.50 |
$3.00 |
$3.50 |
|
|
किमी-के२.५ |
$0.60 |
$3.00 |
$3.60 |
मूनशॉट |
|
GLM-5 |
$1.00 |
$3.20 |
$४.२० |
Z.ai |
|
एर्नी 5.0 |
$०.८५ |
$3.40 |
$४.२५ |
कियानफान |
|
क्लॉड हायकू 4.5 |
$1.00 |
$५.०० |
$६.०० |
मानववंशीय |
|
नाणे ३ कमाल (०१/२३/२०२६) |
$1.20 |
$६.०० |
$७.२० |
अलीबाबा मेघ |
|
मिथुन 3 प्रो (≥200K) |
$2.00 |
$१२.०० |
$१४.०० |
|
|
GPT-5.2 |
$१.७५ |
$१४.०० |
$१५.७५ |
OpenAI |
|
क्लॉड सॉनेट 4.5 |
$3.00 |
$१५.०० |
$18.00 |
मानववंशीय |
|
मिथुन 3 प्रो (>200k) |
$४.०० |
$18.00 |
$२२.०० |
|
|
व्यवसाय बंद करणे 4.6 |
$५.०० |
$२५.०० |
$३०.०० |
मानववंशीय |
|
GPT-5.2 प्रो |
$21.00 |
$168.00 |
$१८९.०० |
OpenAI |
क्लॉड ओपस 4.6 ($5/$25) पेक्षा हे इनपुटच्या बाबतीत सुमारे 6 पट स्वस्त आणि आउटपुटच्या बाबतीत सुमारे 10 पट स्वस्त आहे. या रिलीझने अफवांची पुष्टी केली की त्यामागे झिपू एआय आहे "अल्फा पोनी," लपलेले मॉडेल पूर्वी OpenRouter वर प्रोग्रामिंग मानके क्रश केले.
तथापि, उच्च मानके आणि कमी खर्च असूनही, सर्व प्रारंभिक अवलंबकर्ते या मॉडेलबद्दल उत्साही नव्हते, असे सांगून की त्याच्या उच्च कार्यक्षमतेने संपूर्ण कथा सांगितली नाही.
लुकास पीटरसन, सुरक्षा-केंद्रित स्वायत्त एआय प्रोटोकॉल स्टार्टअप एंडॉन लॅबचे सह-संस्थापक, X वर टिप्पणी दिली: "GLM-5 चे परिणाम वाचल्यानंतर काही तासांनंतर: आश्चर्यकारकपणे प्रभावी मॉडेल, परंतु परिस्थितीजन्य जागरूकता खूपच कमी. तो आक्रमक डावपेचांद्वारे ध्येये साध्य करतो परंतु त्याच्या परिस्थितीचा विचार करत नाही किंवा त्याच्या अनुभवाचा फायदा घेत नाही. हे भितीदायक आहे. अशा प्रकारे तुम्हाला पेपरक्लिप मॅग्निफायर मिळेल."
द "पेपर क्लिप कमाल करा" हे 2003 मध्ये ऑक्सफर्ड तत्वज्ञानी निक बोस्ट्रॉम यांनी वर्णन केलेल्या काल्पनिक परिस्थितीचा संदर्भ देते, ज्यामध्ये एआय किंवा इतर स्वायत्त निर्मिती चुकून एक सर्वनाश परिस्थिती आणते किंवा उशिर सौम्य सूचनांचे पालन करून मानवी विलोपन घडवून आणते-जसे की उत्पादित कागदाच्या क्लिपची संख्या वाढवणे-जसे की मानवी जीवनासाठी आवश्यक किंवा इतर सर्व संसाधने पुनर्निर्देशित करणे. वरवर सौम्य ध्येय साध्य करण्यासाठी त्याच्या वचनबद्धतेद्वारे अशक्य.
तुमच्या संस्थेने GLM-5 चा अवलंब करावा का?
वेंडर लॉक-इनमधून बाहेर पडू पाहणाऱ्या कंपन्यांना MIT चे GLM-5 चे परवाना आणि ओपन वेट्सची उपलब्धता हा एक मोठा धोरणात्मक फायदा समजेल. क्लोज-सोर्स स्पर्धकांच्या विपरीत जे बुद्धिमत्ता मालकीच्या भिंतींच्या मागे ठेवतात, GLM-5 संस्थांना त्यांची बुद्धिमत्ता सीमा स्तरावर होस्ट करण्याची परवानगी देते.
दत्तक घेणे हे घर्षणाशिवाय नसते. GLM-5 — 744B — साठी पॅरामीटर्सच्या पूर्ण श्रेणीसाठी मोठ्या हार्डवेअर मजल्याची आवश्यकता आहे जी मोठ्या क्लाउड किंवा ऑन-प्रिमाइस GPU क्लस्टर नसलेल्या छोट्या कंपन्यांच्या आवाक्याबाहेर असू शकते.
सुरक्षा नेत्यांनी चीन-आधारित प्रयोगशाळेतील महत्त्वाच्या मॉडेलच्या भौगोलिक-राजकीय परिणामांचे वजन करणे आवश्यक आहे, विशेषत: नियमन केलेल्या उद्योगांमध्ये जेथे डेटा आणि त्याच्या मूळतेची काटेकोरपणे तपासणी केली जाते.
शिवाय, अधिक स्वायत्त एआय एजंट्सकडे वळल्याने नवीन प्रशासन धोके निर्माण होतात. मॉडेल देखील पासून हलवा "संभाषण" करण्यासाठी "नोकरी," ते सर्व अनुप्रयोग आणि फाइल्सवर स्वतंत्रपणे कार्य करण्यास सुरवात करतात. एजंट-विशिष्ट परवानग्या आणि एंटरप्राइझ डेटा लीडर्सद्वारे तयार केलेल्या मानवी गुणवत्तेच्या गेट्सशिवाय, व्यक्तिनिष्ठ त्रुटीचा धोका नाटकीयरित्या वाढतो.
शेवटी, GLM-5 आहे "तो खरेदी करतो" ज्या संस्था साध्या सह-वैमानिकांच्या पलीकडे गेल्या आहेत आणि खरोखर स्वायत्त कार्यालय तयार करण्यास तयार आहेत.
हे अभियंत्यांसाठी आहे ज्यांना वारसा बॅकएंड पुन्हा तयार करण्याची आवश्यकता आहे किंवा ज्यांना आवश्यक आहे "स्वत: ची उपचार" पाइपलाइन कधीही झोपत नाही.
पाश्चात्य प्रयोगशाळा सुधारत असताना "विचार करत आहे" सखोल विचार करून, झाई अंमलबजावणी आणि प्रमाण सुधारत आहे.
आज GLM-5 स्वीकारणाऱ्या कंपन्या केवळ स्वस्त मॉडेल विकत घेत नाहीत; ते अशा भविष्यावर पैज लावत आहेत ज्यामध्ये सर्वात मौल्यवान एआय आहे जो दोनदा न विचारता प्रकल्प पूर्ण करू शकतो.
















