आजच्या मॉडेल्सवर बनवलेले एजंट सहसा साध्या बदलांसह खंडित होतात—एक नवीन लायब्ररी, एक वर्कफ्लो चिमटा—आणि त्यांचे निराकरण करण्यासाठी मानवी अभियंत्याची आवश्यकता असते. एंटरप्राइझमध्ये AI तैनात करण्यामधील हे सर्वात कठीण आव्हानांपैकी एक आहे: सतत नियंत्रण न ठेवता डायनॅमिक वातावरणाशी जुळवून घेऊ शकणारे एजंट तयार करणे. आजचे मॉडेल शक्तिशाली असले तरी ते मोठ्या प्रमाणावर स्थिर आहेत.
या समस्येचे निराकरण करण्यासाठी, कॅलिफोर्निया विद्यापीठ, सांता बार्बरा येथील संशोधकांनी विकसित केले गट विकास प्रतिनिधी (GEA), एक नवीन फ्रेमवर्क जे AI एजंट्सच्या गटांना एकत्र विकसित करण्यास, अनुभव सामायिक करण्यास आणि कालांतराने स्वतंत्रपणे सुधारण्यासाठी त्यांच्या नवकल्पनांचा पुनर्वापर करण्यास सक्षम करते.
जटिल प्रोग्रामिंग आणि सॉफ्टवेअर अभियांत्रिकी कार्यांवरील प्रयोगांमध्ये, GEA विद्यमान स्वयं-ऑप्टिमायझेशन फ्रेमवर्कला लक्षणीयरीत्या मागे टाकते. एंटरप्राइझ निर्णय निर्मात्यांसाठी कदाचित सर्वात लक्षणीय, सिस्टमने स्वतंत्रपणे घटक विकसित केले आहेत जे मानवी तज्ञांनी परिश्रमपूर्वक डिझाइन केलेल्या फ्रेमवर्कच्या कार्यप्रदर्शनाशी जुळणारे किंवा त्याहून अधिक आहेत.
“लोन वुल्फ” उत्क्रांतीच्या मर्यादा
सर्वाधिक अस्तित्वात आहे एजंट एआय सिस्टम हे अभियंत्यांनी डिझाइन केलेल्या निश्चित संरचनांवर अवलंबून असते. या प्रणाली सहसा त्यांच्या सुरुवातीच्या डिझाइनद्वारे लादलेल्या क्षमता मर्यादा ओलांडण्यासाठी संघर्ष करतात.
या समस्येचे निराकरण करण्यासाठी, संशोधकांनी बर्याच काळापासून स्वयं-विकसित एजंट तयार करण्याचा प्रयत्न केला आहे जे त्यांच्या सुरुवातीच्या मर्यादांवर मात करण्यासाठी त्यांचे कोड आणि संरचना स्वतंत्रपणे बदलू शकतात. ही क्षमता खुल्या वातावरणात हाताळण्यासाठी आवश्यक आहे जिथे एजंटने सतत नवीन उपाय शोधले पाहिजेत.
तथापि, स्वयंउत्क्रांतीच्या सध्याच्या पद्धतींमध्ये एक प्रमुख संरचनात्मक दोष आहे. संशोधकांनी त्यांच्या शोधनिबंधात नमूद केल्याप्रमाणे, बहुतेक प्रणाली जैविक उत्क्रांतीपासून प्रेरित आणि डिझाइन केलेल्या आहेत. "वैयक्तिक-केंद्रित" ऑपरेशन्स. या पद्धती सामान्यत: वृक्ष-संरचित दृष्टिकोन वापरतात: एकल पद्धत "पालक" एक कार्यकर्ता संतती निर्माण करण्यासाठी निवडला जातो, भिन्न उत्क्रांती शाखा तयार करतो ज्या एकमेकांपासून पूर्णपणे वेगळ्या राहतात.
हे अलगाव एक सायलो प्रभाव तयार करते. एका शाखेतील एजंट समांतर शाखेतील एजंटने शोधलेल्या डेटा, टूल्स किंवा वर्कफ्लोमध्ये प्रवेश करू शकत नाही. पुढील पिढीसाठी विशिष्ट स्ट्रेन निवडण्यात अयशस्वी झाल्यास, त्या एजंटने केलेले कोणतेही मौल्यवान शोध, जसे की नवीन डीबगिंग साधन किंवा अधिक कार्यक्षम चाचणी कार्यप्रवाह, त्याच्याबरोबर जातो.
त्यांच्या शोधनिबंधात, संशोधक या जैविक रूपकाचे पालन करण्याच्या आवश्यकतेवर प्रश्न करतात. "एआय एजंट हे जैविक व्यक्ती नाहीत;" ते वाद घालतात. "त्यांचा विकास जैविक मॉडेल्सने का मर्यादित ठेवला पाहिजे?"
समूहाच्या उत्क्रांत एजंट्सची एकत्रित बुद्धिमत्ता
GEA विकासाचे मूलभूत एकक म्हणून वैयक्तिक ऐवजी एजंट्सच्या गटाला मानून प्रतिमान बदलत आहे.
विद्यमान संग्रहणातून मूळ एजंट्सचा संच निवडून प्रक्रिया सुरू होते. स्थिरता आणि नावीन्य यांचे निरोगी मिश्रण सुनिश्चित करण्यासाठी, GEA या एजंट्सना त्यांच्या एकत्रित कामगिरीच्या स्कोअर (कार्ये सोडवण्यात प्रवीणता) आणि नवीनता (त्यांच्या क्षमता इतरांपेक्षा कशा वेगळ्या आहेत) यावर आधारित निवडतात.
पारंपारिक सिस्टीमच्या विपरीत जेथे एजंट थेट मूळ कंपनीकडूनच शिकतो, GEA सामूहिक कौशल्याचा एक सामायिक पूल तयार करते. या असेंब्लीमध्ये मूळ संग्रहातील सर्व सदस्यांच्या उत्क्रांती कलाकृतींचा समावेश आहे, ज्यामध्ये कोड बदल, कार्यांचे यशस्वी निराकरण आणि टूल इनोकेशन इतिहास यांचा समावेश आहे. गटातील प्रत्येक एजंटला या सामूहिक इतिहासात प्रवेश असतो, ज्यामुळे त्यांना त्यांच्या समवयस्कांच्या कामगिरी आणि चुकांमधून शिकता येते.
मोठ्या भाषिक मॉडेलद्वारे समर्थित रिफ्लेक्शन मॉड्यूल, समूह स्तरावर नमुने ओळखण्यासाठी या सामूहिक इतिहासाचे विश्लेषण करते. उदाहरणार्थ, जर एखाद्या एजंटला उच्च-कार्यक्षमता डीबगर सापडला तर दुसरा एजंट चाचणी वर्कफ्लोमध्ये प्रभुत्व मिळवतो, तर सिस्टम दोन्ही अंतर्दृष्टी काढेल. या विश्लेषणाच्या आधारे, सिस्टम उच्च पातळी निर्माण करते "विकासाची दिशा" जे उपसमूहाच्या निर्मितीसाठी मार्गदर्शन करते. हे सुनिश्चित करते की पुढच्या पिढीकडे त्यांच्या सर्व पालकांची सामाईक सामर्थ्ये आहेत, फक्त एका जातीची वैशिष्ट्ये ऐवजी.
तथापि, जेव्हा प्रोग्रामिंग कार्यांप्रमाणे यश वस्तुनिष्ठ असते तेव्हा हा हायव्ह माइंड दृष्टीकोन सर्वोत्तम कार्य करतो. "कमी निर्धारवादी डोमेनसाठी (उदा. सर्जनशीलता निर्माण करणे), मूल्यमापन सिग्नल कमकुवत आहेत," झाओटियन वेंग आणि चेन एरिक वांग, पेपरचे सह-लेखक, लिखित टिप्पण्यांमध्ये व्हेंचरबीटला सांगितले. "आंधळेपणाने आउटपुट आणि अनुभव सामायिक केल्याने कमी-गुणवत्तेचे अनुभव येऊ शकतात ज्यात आवाज येतो. हे फिल्टरिंग तज्ञांसाठी मजबूत यंत्रणेच्या गरजेकडे निर्देश करते" स्व-कार्यांसाठी.
GEA कृतीत आहे
संशोधकांनी विद्यमान स्वयं-विकसित बेसलाइन विरुद्ध जीईएची चाचणी केली, जी आहे… डार्विन गोडेलचे मशीन (DGM), दोन कठोर निकषांवर आधारित. परिणामांनी वापरलेल्या एजंटची संख्या न वाढवता सत्तेत मोठी उडी दर्शविली.
हा सहयोगी दृष्टीकोन अपयशाविरूद्ध प्रणाली अधिक मजबूत बनवतो. त्यांच्या प्रयोगांमध्ये, संशोधकांनी जाणूनबुजून त्यांच्या ऍप्लिकेशन्समध्ये बग इंजेक्ट करून एजंटांना तोडले. GEA सरासरी 1.4 पुनरावृत्तीमध्ये या गंभीर त्रुटींचे निराकरण करण्यात सक्षम होते, तर बेसलाइनने 5 पुनरावृत्ती घेतली. प्रणाली प्रभावी वापर करते "बरोबर" जोखीम असलेल्या परिस्थितीचे निदान आणि दुरुस्त करण्यासाठी गट सदस्य.
SWE-बेंच सत्यापित चाचणीमध्ये, बग आणि वैशिष्ट्य विनंत्यांसह वास्तविक GitHub समस्यांचा समावेश असलेला बेंचमार्क, GEA ने 56.7% च्या बेसलाइनच्या तुलनेत 71.0% यश मिळवले. हे फ्रीलान्स अभियांत्रिकी उत्पादकतेत लक्षणीय वाढ होते, याचा अर्थ एजंट वास्तविक-जागतिक सॉफ्टवेअर देखभाल हाताळण्यास अधिक सक्षम आहेत. त्याचप्रमाणे, पॉलीग्लॉटमध्ये, जे विविध प्रोग्रामिंग भाषांमध्ये कोड निर्मितीची चाचणी घेते, GEA ने मूलभूत 68.3% विरुद्ध 88.3% मिळवले, जे विविध तंत्रज्ञानाच्या स्टॅकसाठी उच्च अनुकूलता दर्शवते.
एंटरप्राइझ R&D संघांसाठी, सर्वात महत्त्वाचा शोध म्हणजे GEA AI ला मानवी अभियंत्यांप्रमाणेच स्वतःची रचना करू देते. SWE प्लॅटफॉर्मवर, GEA चा 71.0% चा यश दर प्रभावीपणे याच्या कामगिरीशी जुळतो… हात उघडामानवांनी डिझाइन केलेली सर्वोत्तम मुक्त स्रोत फ्रेमवर्क. पॉलीग्लॉटमध्ये, GEA ने Aider, एक लोकप्रिय कोडिंग मदत, ज्याने 52.0% गाठले, लक्षणीयरित्या मागे टाकले. हे सूचित करते की एजंट फ्रेमवर्क सुधारण्यासाठी संस्था अखेरीस ऑन-द-फ्लाय इंजिनियर्सच्या मोठ्या संघांवर त्यांचे अवलंबन कमी करू शकतात, कारण एजंट या सुधारणा स्वतंत्रपणे शिकू शकतात.
ही कार्यक्षमता खर्च व्यवस्थापनापर्यंत विस्तारते. "GEA ही दोन-चरण प्रणाली आहे: (1) एजंट उत्क्रांती, नंतर (2) अनुमान/उपयोजन," असे संशोधकांनी सांगितले. "उत्क्रांतीनंतर, तुम्ही एकच विकसित एजंट तैनात करू शकता…म्हणून एंटरप्राइझ अनुमानाची किंमत एक मानक सिंगल-एजंट सेटअपच्या तुलनेत अपरिवर्तित आहे."
GEA चे यश मुख्यत्वे त्याच्या सुधारणा चालविण्याच्या क्षमतेमुळे उद्भवते. संशोधकांनी उत्क्रांती प्रक्रियेदरम्यान एजंटांनी शोधलेल्या विशिष्ट नवकल्पनांचा मागोवा घेतला आहे. मूलभूत पध्दतीमध्ये, मौल्यवान साधने अनेकदा वेगळ्या शाखांमध्ये दिसू लागली परंतु ती विशिष्ट वंश कालबाह्य झाल्यामुळे पसरण्यास अयशस्वी झाली. GEA मध्ये, सामायिक अनुभव मॉडेल हे सुनिश्चित करते की ही साधने सर्वोत्तम कामगिरी करणाऱ्या डीलर्सद्वारे स्वीकारली जातात. सर्वोत्कृष्ट GEA एजंटने 17 अद्वितीय पूर्वजांचे गुणधर्म समाविष्ट केले (28% लोकसंख्येचे प्रतिनिधित्व करतात) तर सर्वोत्तम बेस एजंटने केवळ 9 मधील गुणांचा समावेश केला. खरं तर, GEA ने निर्माण केले… "सुपर कर्मचारी" ज्याने संपूर्ण गटासाठी सर्वोत्तम पद्धती एकत्रित केल्या आहेत.
"उत्पादनातील GEA-प्रेरित वर्कफ्लो डीलर्सना ब्रेकडाउन झाल्यावर काही स्वतंत्र दुरुस्ती करण्याचा प्रयत्न करण्यास अनुमती देईल," संशोधकांनी या स्वयं-उपचार क्षमतेबद्दल स्पष्ट केले. "एक परावर्तक (सामान्यत: मजबूत अंतर्निहित मॉडेलद्वारे समर्थित) परिणामांचा सारांश देऊ शकतो… आणि अधिक व्यापक सिस्टम अपडेटचे मार्गदर्शन करू शकतो."
शिवाय, GEA ने शोधलेल्या सुधारणा विशिष्ट बेस मॉडेलशी जोडलेल्या नाहीत. क्लॉड सारख्या एकाच मॉडेलसह डीलर्स विकसित झाले आणि बेस इंजिन GPT-5.1 किंवा GPT-o3-मिनी सारख्या दुसऱ्या मॉडेल फॅमिलीमध्ये बदलले गेले तरीही कामगिरी वाढवली. ही पोर्टेबिलिटी संस्थांना त्यांच्या एजंटांनी शिकलेल्या सानुकूल वास्तुशिल्प सुधारणा न गमावता मॉडेल प्रदाते स्विच करण्याची लवचिकता प्रदान करते.
कठोर अनुपालन आवश्यकता असलेल्या उद्योगांसाठी, स्वयं-सुधारणा कोडची कल्पना धोकादायक वाटू शकते. याचे निराकरण करण्यासाठी, लेखक म्हणाले: "आम्ही एंटरप्राइझ उपयोजनांमध्ये नॉन-स्केलेबल रेलिंग असण्याची अपेक्षा करतो, जसे की सँडबॉक्स अंमलबजावणी, धोरण मर्यादा आणि सत्यापन स्तर."
संशोधकांनी लवकरच अधिकृत कोड रिलीझ करण्याची योजना आखली असताना, विकसक आधीपासूनच विद्यमान एजंट फ्रेमवर्कच्या शीर्षस्थानी सिद्धांतानुसार GEA आर्किटेक्चरची अंमलबजावणी सुरू करू शकतात. सिस्टमला स्टँडर्ड एजंट सूटमध्ये तीन मुख्य जोडणी आवश्यक आहेत: उत्क्रांती ट्रेस संग्रहित करण्यासाठी “अनुभव संग्रह”, जोडलेल्या पॅटर्नचे विश्लेषण करण्यासाठी “प्रतिबिंब मॉड्यूल” आणि एक “अपडेट मॉड्यूल” जे एजंटला त्या अंतर्दृष्टीच्या आधारावर त्याचा कोड सुधारण्याची परवानगी देते.
भविष्याकडे पाहता, फ्रेमवर्क प्रगत एजंट्सच्या विकासाचे लोकशाहीकरण करू शकते. "एक आशादायक प्रवृत्ती म्हणजे संकरित उत्क्रांती पाइपलाइन," संशोधक म्हणाले, "लहान मॉडेल्स विविध अनुभव जमा करण्यासाठी लवकर एक्सप्लोर करतात आणि मजबूत मॉडेल्स नंतर त्या अनुभवांचा वापर करून उत्क्रांतीचे मार्गदर्शन करतात."
















