चीनी ई-कॉमर्स कंपनी अलीबाबा मधील AI संशोधकांची क्वेनची टीम गेल्या वर्षी ओपन सोर्स AI डेव्हलपमेंटमध्ये जागतिक नेत्यांपैकी एक म्हणून उदयास आली, ज्याने शक्तिशाली मोठ्या प्रमाणातील भाषा मॉडेल्स आणि विशिष्ट मल्टी-मॉडल मॉडेल्सचा संच जारी केला जो काही प्रकरणांमध्ये, OpenAI, Anthropic, Google आणि xAI सारख्या यूएस नेत्यांच्या कामगिरीच्या अगदी जवळ येतो.
आता टीम क्वेन या आठवड्यात पुन्हा एकदा परत आली आहे "वातावरण कोडिंग" अलीकडच्या काही महिन्यांची क्रेझ: Qwen3-Coder-Next, एक विशेष 80 अब्ज पॅरामीटर मॉडेल हलक्या वजनाच्या सक्रिय फूटप्रिंटमध्ये एलिट प्रॉक्सी कार्यप्रदर्शन देण्यासाठी डिझाइन केलेले आहे.
हे परवानगी असलेल्या Apache 2.0 परवान्यासह जारी केले गेले आहे, जे मोठ्या उद्योगांना आणि स्वतंत्र विकासकांद्वारे व्यावसायिक वापर करण्यास सक्षम करते, हगिंग फेसवर चार वेगवेगळ्या प्रकारांमध्ये मॉडेल वजन उपलब्ध आहे आणि काही प्रशिक्षण पद्धती आणि नवकल्पनांचे वर्णन करणारा तांत्रिक अहवाल.
रिलीझने अंतिम प्रोग्रामिंग असिस्टंटसाठी जागतिक शस्त्रास्त्रांच्या शर्यतीत मोठी वाढ दर्शविली आहे, एका आठवड्यानंतर नवीन प्रवेशकर्त्यांसह फील्डचा स्फोट झाला. अँथ्रोपिकच्या क्लॉड कोडच्या प्रचंड कार्यक्षमतेपासून ते OpenAI कोडेक्सच्या हाय-प्रोफाइल लाँचपर्यंत आणि OpenClaw सारख्या मुक्त स्रोत फ्रेमवर्कचा जलद समुदाय स्वीकारण्यापर्यंत, स्पर्धात्मक लँडस्केप कधीही जास्त गर्दीचे नव्हते.
या उच्च-स्थिर वातावरणात, अलीबाबा केवळ प्रगतीचा वेग राखत नाही, तर खुल्या वजनाच्या बुद्धिमत्तेसाठी एक नवीन मानक स्थापित करण्याचा प्रयत्न करत आहे.
LLM निर्णय घेणाऱ्यांसाठी, Qwen3-Coder-Next हे AI अभियांत्रिकीच्या अर्थशास्त्रातील मूलभूत बदलाचे प्रतिनिधित्व करते. मॉडेलमध्ये एकूण 80 अब्ज पॅरामीटर्स असताना, ते अत्यंत विरळ तज्ञ (MoE) आर्किटेक्चर वापरते जे प्रति फॉरवर्ड पास केवळ 3 अब्ज पॅरामीटर्स सक्रिय करते.
हे डिझाइन कमी तैनाती खर्च आणि हलक्या वजनाच्या ऑन-प्रिमाइसेस मॉडेलचे उच्च थ्रुपुट राखून मोठ्या मालकीच्या प्रणालींना टक्कर देणारी अनुमान क्षमता प्रदान करण्यास अनुमती देते.
दीर्घ संदर्भातील अडचण सोडवा
Qwen3-Coder-Next यामागील मुख्य तांत्रिक प्रगती ही एक हायब्रिड आर्किटेक्चर आहे जी विशेषत: पारंपारिक कन्व्हर्टरला त्रास देणाऱ्या चतुर्भुज स्केलिंग समस्यांना दूर करण्यासाठी डिझाइन केलेली आहे.
कॉन्टेक्स्ट विंडो जसजशी विस्तारते-आणि हे मॉडेल तब्बल 262,144 टोकन्सचे समर्थन करते—पारंपारिक लक्ष यंत्रणा संगणकीयदृष्ट्या महाग बनते.
मानक ट्रान्सफॉर्मर ग्रस्त अ "मेमरी भिंत" प्रक्रियेच्या संदर्भाची किंमत अनुक्रमाच्या लांबीसह चतुर्भुज वाढते. Gated DeltaNet आणि Gated Attention एकत्र करून क्वेन हे संबोधित करते.
डेल्टानेट गेट मानक सॉफ्टमॅक्स अटेंशनच्या रेखीय जटिलतेला पर्याय म्हणून काम करते. हे मॉडेलला चतुर्थांश-दशलक्ष-प्रतीक विंडोमध्ये दीर्घ-क्षितिज अनुमानाच्या विशिष्ट घातांकीय विलंब दंडाशिवाय स्थिती राखण्यास अनुमती देते.
अत्यंत विरळ MoE सह एकत्रित केल्यावर, समान एकूण क्षमतेच्या दाट मॉडेलपेक्षा वेअरहाऊस-स्तरीय कार्यांसाठी 10x जास्त थ्रूपुट आहे.
ही रचना खात्री देते की एजंट हे करू शकतो "तो वाचतो" एक संपूर्ण पायथन लायब्ररी किंवा जटिल JavaScript फ्रेमवर्क जे 3B मॉडेलच्या वेगाने प्रतिसाद देते, परंतु 80B प्रणालीच्या संरचनात्मक समजासह.
प्रशिक्षणादरम्यान संदर्भित भ्रम टाळण्यासाठी, संघाने सर्वोत्तम-इन-क्लास फिल (BFP) वापरला, एक धोरण जी पारंपारिक दस्तऐवज मालिकेमध्ये आढळलेल्या ट्रंकेशन त्रुटींशिवाय कार्यक्षमता राखते.
प्रथम एजंट होण्यासाठी प्रशिक्षण द्या
द "पुढील" मॉडेलचे नामकरण प्रशिक्षण पद्धतीतील मूलभूत अक्षांना सूचित करते. ऐतिहासिकदृष्ट्या, कोडींग मॉडेलना स्थिर स्क्रिप्ट जोड्यांवर प्रशिक्षित केले गेले आहे – मुख्यतः अ "केवळ वाचनीय" शिक्षण त्याऐवजी Qwen3-Coder-Next मोठ्या प्रक्रियेद्वारे विकसित केले गेले "एजंट प्रशिक्षण" पाइपलाइन
तांत्रिक अहवालात एका संश्लेषण पाइपलाइनचा तपशील आहे ज्याने 800,000 सत्यापित कोडिंग जॉब्स व्युत्पन्न केले. हे केवळ उतारे नव्हते. ते GitHub पुल विनंत्यांमधून काढलेले आणि पूर्णपणे एक्झिक्युटेबल वातावरणासह पेअर केलेले वास्तविक-जागतिक बगफिक्सिंग परिदृश्य होते.
प्रशिक्षण पायाभूत सुविधा, ज्याला मेगाफ्लो म्हणून ओळखले जाते, ही अलीबाबा क्लाउड कुबर्नेट्सवर आधारित क्लाउड-नेटिव्ह ऑर्केस्ट्रेशन प्रणाली आहे. मेगाफ्लोमध्ये, प्रत्येक एजंट कार्य तीन-टप्प्यांवरील कार्यप्रवाह म्हणून व्यक्त केले जाते: एजंट रोलआउट, मूल्यांकन आणि पोस्ट-प्रोसेसिंग. रोलआउट दरम्यान, मॉडेल थेट कंटेनर वातावरणाशी संवाद साधते.
जर तो कोड तयार करतो जो युनिट चाचणीमध्ये अयशस्वी झाला किंवा कंटेनर क्रॅश झाला, तर त्याला मध्यवर्ती प्रशिक्षण आणि मजबुतीकरण शिक्षणाद्वारे त्वरित अभिप्राय प्राप्त होतो. हे "बंद लूप" शिकण्यामुळे मॉडेलला पर्यावरणाच्या फीडबॅकमधून शिकण्याची परवानगी मिळते, त्रुटींमधून कसे पुनर्प्राप्त करावे आणि रिअल टाइममध्ये निराकरणे कशी सुधारायची हे शिकवते.
उत्पादन वैशिष्ट्यांमध्ये हे समाविष्ट आहे:
-
370 प्रोग्रामिंग भाषांना समर्थन द्या: मागील आवृत्त्यांमधील 92 वरून विस्तारित.
-
XML-शैली विजेट कॉल करणे: स्ट्रिंग-हेवी मीडियासाठी डिझाइन केलेले एक नवीन qwen3_coder फॉरमॅट, जे मॉडेलला क्रॉस-कोटिंगशिवाय आणि नेहमीच्या JSON ओव्हरहेडमधून बाहेर न पडता कोडचे लांब स्निपेट सोडू देते.
-
वेअरहाऊस स्तरावर लक्ष केंद्रित करा: रिपॉझिटरी-स्तरीय डेटाचे अंदाजे 600 अब्ज चिन्हे समाविष्ट करण्यासाठी मध्यम प्रशिक्षणाचा विस्तार केला गेला आहे, जे केवळ फाइल-स्तरीय डेटासेटपेक्षा क्रॉस-फाइल अवलंबित्व तर्कावर अधिक प्रभावी असल्याचे सिद्ध करते.
तज्ञ मॉडेलद्वारे स्पेशलायझेशन
Qwen3-Coder-Next पाइपलाइनमधील महत्त्वाच्या फरकांपैकी एक म्हणजे विशेष तज्ञ मॉडेल्सचा वापर. सर्व कार्यांसाठी एक सामान्य मॉडेल प्रशिक्षित करण्याऐवजी, टीमने वेब विकास आणि वापरकर्ता अनुभव (UX) मध्ये विशिष्ट तज्ञ विकसित केले.
वेब डेव्हलपमेंट तज्ञ वापरकर्ता इंटरफेस तयार करणे आणि घटक कॉन्फिगर करणे यासारखी पूर्ण कार्ये लक्ष्यित करतो. सर्व कोड नमुने नाटककार-नियंत्रित Chromium वातावरणात प्रस्तुत केले गेले.
प्रतिक्रिया फॉर्मसाठी, सर्व अवलंबन योग्यरित्या कॉन्फिगर केले आहेत याची खात्री करण्यासाठी Vite सर्व्हर तैनात केला जातो. त्यानंतर व्हिजन लँग्वेज मॉडेल (VLM) ने लेआउट अखंडता आणि वापरकर्ता इंटरफेस गुणवत्तेनुसार प्रस्तुत पृष्ठांचा न्याय केला.
Cline आणि OpenCode सारख्या विविध CLI/IDE स्कॅफोल्ड्सवर टूल कॉल फॉरमॅटिंगचे पालन करण्यासाठी वापरकर्ता अनुभव तज्ञ ऑप्टिमाइझ केले गेले आहेत. टीमला असे आढळले की टूल्सच्या विविध चॅट टेम्प्लेट्सवरील प्रशिक्षणाने तैनातीच्या वेळी न दिसणाऱ्या स्कीमांविरूद्ध मॉडेलच्या मजबूतपणात लक्षणीय सुधारणा केली.
एकदा या तज्ञांनी सर्वोच्च कामगिरी गाठली की, त्यांची क्षमता पुन्हा एकल 80B/3B MoE मॉडेलमध्ये आणली गेली. हे सुनिश्चित करते की लाइटवेट उपयोजन आवृत्ती मोठ्या वैशिष्ट्य मॉडेलची ग्रॅन्युलॅरिटी राखून ठेवते.
उच्च सुरक्षा उपाय प्रदान करताना मानकांना पंच करणे
या विशेष प्रशिक्षणाचे परिणाम इंडस्ट्रीतील दिग्गजांच्या विरोधात मॉडेलच्या स्पर्धात्मक स्थितीत स्पष्ट होतात. SWE-एजंट स्कॅफोल्ड वापरून केलेल्या बेंचमार्क मूल्यांकनांमध्ये, Qwen3-Coder-Next ने त्याच्या सक्रिय पॅरामीटर्सच्या संख्येच्या तुलनेत अपवादात्मक कार्यक्षमता दर्शविली.
SWE-Bench Verified चाचणीमध्ये, मॉडेलने 70.6% गुण मिळवले. हे कार्यप्रदर्शन खूप मोठ्या मॉडेल्सच्या बरोबरीने ठेवलेले असताना हे उल्लेखनीय स्पर्धात्मक आहे; हे DeepSeek-V3.2 ला मागे टाकते, ज्याने 70.2% गुण मिळवले आणि GLM-4.7 च्या 74.2% पेक्षा थोडे मागे आहे.
सर्वात महत्त्वाचे म्हणजे, मॉडेल मजबूत अंतर्निहित सुरक्षा जागरूकता प्रदर्शित करते. SecCodeBench मध्ये, जे भेद्यता दुरुस्त करण्याच्या मॉडेलच्या क्षमतेचे मूल्यमापन करते, Qwen3-Coder-Next ने कोड जनरेशन परिदृश्यांमध्ये क्लॉड-Opus-4.5 पेक्षा जास्त कामगिरी केली (61.2% वि. 52.5%).
विशेष म्हणजे, त्याला कोणतेही सुरक्षा संकेत दिलेले नसतानाही उच्च स्कोअर राखले, हे सूचित करते की एजंटच्या 800,000-टास्क प्रशिक्षण टप्प्यात सामान्य सुरक्षा जोखमींचा अंदाज घेणे शिकले आहे.
बहुभाषिक सुरक्षा मूल्यमापनांमध्ये, मॉडेलने फंक्शनल आणि सुरक्षित कोड जनरेशनमधील स्पर्धात्मक समतोल देखील प्रदर्शित केला, ज्याने 56.32% च्या func-sec@1 स्कोअरसह CWEval बेंचमार्कवर DeepSeek-V3.2 आणि GLM-4.7 या दोन्हींना मागे टाकले.
शाही दिग्गजांना आव्हान द्या
2026 मधील बंद स्त्रोत कोडिंग मॉडेल्सच्या वर्चस्वासाठी हे प्रकाशन सर्वात महत्त्वाचे आव्हान आहे. हे सिद्ध करून की केवळ 3B सक्रिय पॅरामीटर्स असलेले मॉडेल वास्तविक-जगातील सॉफ्टवेअर अभियांत्रिकीतील गुंतागुंत इतर कोणत्याही मॉडेलप्रमाणे प्रभावीपणे नेव्हिगेट करू शकते. "राक्षस" अलीबाबाने प्रॉक्सी कोडिंगचे प्रभावीपणे लोकशाहीकरण केले आहे.
द "अहाहा!" एजंटच्या यशासाठी संदर्भाची लांबी आणि उत्पादकता हे दोन महत्त्वाचे घटक आहेत याची जाणीव हा उद्योगासाठी मोठा क्षण आहे.
एक मॉडेल जे 262k रेपॉजिटरी टोकन्सवर काही सेकंदात प्रक्रिया करू शकते आणि डॉकर कंटेनरमध्ये त्याचे ऑपरेशन सत्यापित करू शकते ते मोठ्या मॉडेलपेक्षा मूलभूतपणे अधिक उपयुक्त आहे जे प्रतिकृती तयार करण्यासाठी खूप हळू किंवा खूप महाग आहे.
क्विनच्या टीमने त्यांच्या अहवालात निष्कर्ष काढल्याप्रमाणे: "स्केलिंग एजंट प्रशिक्षण, केवळ मॉडेल आकारापेक्षा, वास्तविक-जगातील एजंट कोडिंग क्षमता विकसित करण्यासाठी एक प्रमुख चालक आहे". Qwen3-Coder-Next सह, हे एक युग आहे "मॅमथ" कदाचित प्रोग्रामिंग प्रतिमान समाप्त होत आहे, विखुरलेल्या, अति-जलद तज्ञांनी बदलले आहे जे शक्य तितक्या खोलवर विचार करू शकतात.
















