गेल्या वर्षभरात, एंटरप्राइझ एआय समुदाय एआय एजंटना किती स्वातंत्र्य द्यावे याबद्दल वादविवादात गुंतले आहे. खूप कमी, आणि तुम्हाला महागडे वर्कफ्लो ऑटोमेशन मिळेल जे केवळ न्याय्य ठरते "घटक" संलग्न खूप जास्त, आणि तुम्हाला अशा प्रकारच्या डेटा-वाइपिंग आपत्ती मिळतील ज्याने OpenClaw सारख्या साधनांचा प्रारंभिक अवलंब करणाऱ्यांना त्रास दिला. या आठवड्यात, गुगल लॅब्सने ओपल, त्याच्या नो-कोड व्हिज्युअल प्रॉक्सी बिल्डरला एक अपडेट जारी केले, जे शांतपणे उत्तरावर पोहोचते — आणि प्रॉक्सी धोरणाची योजना आखणाऱ्या प्रत्येक IT नेत्याने काळजीपूर्वक विचार केला पाहिजे असे धडे आहेत.

Google काय कॉल करते ते अपडेट सादर करते… "एजंट पाऊल" जे ओपलच्या पूर्वीच्या स्थिर ड्रॅग-अँड-ड्रॉप वर्कफ्लोला डायनॅमिक, परस्परसंवादी अनुभवांमध्ये रूपांतरित करते. कोणते मॉडेल किंवा टूल आणि कोणत्या क्रमाने कनेक्ट करायचे हे मॅन्युअली निर्दिष्ट करण्याऐवजी, निर्माते आता लक्ष्य निर्दिष्ट करू शकतात आणि एजंटला ते पोहोचण्यासाठी सर्वोत्तम मार्ग ठरवू शकतात – साधने निवडणे, व्हिडिओ तयार करण्यासाठी Gemini 3 Flash किंवा Veo सारखी मॉडेल्स चालवणे आणि वापरकर्त्यांना अधिक माहितीची आवश्यकता असताना त्यांच्याशी संभाषण सुरू करणे.

उत्पादनासाठी एक माफक अद्यतनासारखे दिसते. तसे नाही. 2026 मध्ये एंटरप्राइझ एजंट्स परिभाषित करणाऱ्या तीन क्षमतांसाठी Google ने जे पाठवले आहे ते कार्यरत संदर्भ आर्किटेक्चर आहे:

  1. अनुकूली राउटिंग

  2. कायमस्वरूपी स्मृती

  3. मानवी-इन-द-लूप समन्वय

…आणि हे सर्व जेमिनी 3 मालिका सारख्या फ्रंटियर मॉडेल्सच्या वेगाने सुधारणाऱ्या तर्क क्षमतांमुळे शक्य झाले आहे.

एक “ऑफ-कोर्स” इन्फ्लेक्शन पॉइंट: एजंट डिझाइनबद्दल सर्व काही चांगले मॉडेल का बदलतात

ओपल अपडेट इतके महत्त्वाचे का आहे हे समजून घेण्यासाठी, तुम्हाला एजंट इकोसिस्टममध्ये अनेक महिन्यांपासून होत असलेले परिवर्तन समजून घेणे आवश्यक आहे.

एंटरप्राइझ एजंट फ्रेमवर्कची पहिली लहर — CrewAI च्या सुरुवातीच्या आवृत्त्या आणि LangGraph च्या सुरुवातीच्या आवृत्त्यांसारखी साधने — स्वायत्तता आणि नियंत्रण यांच्यातील तणावाद्वारे परिभाषित केली गेली. सुरुवातीची मॉडेल्स खुल्या निर्णय प्रक्रियेत वापरण्यासाठी पुरेसे विश्वसनीय नव्हते. याचा परिणाम असा झाला की प्रॅक्टिशनर्स काय म्हणू लागले "रेल्वेवरील एजंट": एक घट्ट प्रतिबंधित कार्यप्रवाह जेथे प्रत्येक निर्णय बिंदू, प्रत्येक टूल कॉल आणि प्रत्येक उपपथ मानवी विकासकाने आगाऊ परिभाषित करणे आवश्यक आहे.

हा दृष्टीकोन कार्य करत होता, परंतु मर्यादित होता. रेल्वेवर एजंट तयार करणे म्हणजे सिस्टीमला येऊ शकणाऱ्या प्रत्येक संभाव्य स्थितीची अपेक्षा करणे, जे साध्या रेखीय कार्यांपलीकडे कोणत्याही गोष्टीसाठी एकत्रित दुःस्वप्न आहे. आणखी वाईट म्हणजे, याचा अर्थ एजंट नवीन परिस्थितीशी जुळवून घेण्यास असमर्थ आहेत, हीच क्षमता आहे जी एजंट AI ला प्रथम स्थानावर मौल्यवान बनवते.

ॲन्थ्रोपिकच्या क्लॉड ओपस 4.6 आणि सॉनेट 4.6 सारख्या अलीकडील रिलीझसह जेमिनी 3 मालिका, अशा थ्रेशोल्डचे प्रतिनिधित्व करते जिथे मॉडेल्स नियोजन, तर्क आणि स्वत: ची सुधारणा करण्यामध्ये पुरेसे विश्वासार्ह बनले आहेत की रेल बंद होऊ शकतात. गुगलचे ओपल अपडेट ही या बदलाची पावती आहे. नवीन प्रॉक्सी पायरीसाठी निर्मात्यांना वर्कफ्लोद्वारे प्रत्येक मार्ग पूर्व-परिभाषित करण्याची आवश्यकता नाही. त्याऐवजी, वापरकर्त्याच्या ध्येयाचे मूल्यांकन करण्यासाठी, उपलब्ध साधनांचे मूल्यमापन करण्यासाठी आणि क्रियांचा इष्टतम क्रम गतिशीलपणे निर्धारित करण्यासाठी ते अंतर्निहित मॉडेलवर विश्वास ठेवते.

याच पॅटर्नमुळे क्लाउडकोडचा एजंट वर्कफ्लो आणि टूल इनव्होकेशन कार्यान्वित होते: एजंटची पुढील पायरी निर्धारित करण्यासाठी मॉडेल्स पुरेसे चांगले आहेत आणि प्रत्येक त्रुटी मनुष्याने व्यक्तिचलितपणे पुन्हा प्रॉम्प्ट केल्याशिवाय स्वत: बरोबरही. क्लॉड कोडच्या तुलनेत फरक असा आहे की Google आता ही क्षमता विना-कोड ग्राहक उत्पादनामध्ये पॅकेज करत आहे – हे एक मजबूत संकेत आहे की अंतर्निहित तंत्रज्ञान बीटा टप्प्याच्या पलीकडे परिपक्व झाले आहे.

एंटरप्राइझ संघांसाठी, प्रभाव थेट आहे: जर तुम्ही अजूनही एजंट आर्किटेक्चर्स डिझाइन करत असाल ज्यासाठी प्रत्येक आकस्मिकतेसाठी पूर्वनिर्धारित मार्ग आवश्यक असतील, तर तुम्ही कदाचित ओव्हर-इंजिनियरिंग करत आहात. मॉडेलची नवीन पिढी अशा डिझाइन पॅटर्नला सपोर्ट करते जिथे तुम्ही उद्दिष्टे आणि अडथळे परिभाषित करता, साधने प्रदान करता आणि मॉडेलला दिशा हाताळू द्या—प्रोग्रामिंग एजंट्सकडून ते व्यवस्थापित करण्यासाठी.

क्रॉस-सेशन मेमरी: उत्पादन एजंट्सपासून डेमो वेगळे करणारे वैशिष्ट्य

ओपल अपडेटमधील दुसरी मोठी भर म्हणजे कायमस्वरूपी मेमरी. Google आता ओपलला सर्व सत्रांमध्ये माहिती लक्षात ठेवण्याची परवानगी देते — वापरकर्ता प्राधान्ये, मागील परस्परसंवाद आणि जमा केलेले संदर्भ — प्रत्येक वेळी सुरवातीपासून सुरुवात करण्याऐवजी एजंट्सच्या वापरामध्ये सुधारणा करतात.

Google ने ओपल मेमरी सिस्टमची तांत्रिक अंमलबजावणी उघड केलेली नाही. पण डीलरशिप बिल्डिंग कम्युनिटीमध्ये हाच पॅटर्न चांगला प्रस्थापित आहे. OpenClaw सारखी साधने प्रामुख्याने मार्कडाउन आणि JSON फायलींद्वारे मेमरी हाताळतात, एक सोपा दृष्टीकोन जो एकल-वापरकर्ता सिस्टमवर चांगले कार्य करतो. एंटरप्राइझ डिप्लॉयमेंटला एक अवघड समस्या भेडसावते: एकाधिक वापरकर्ते, सत्रे आणि त्यांच्या दरम्यान संवेदनशील संदर्भ लीक न करता सुरक्षितता सीमांवर मेमरी जतन करणे.

एकल-वापरकर्ता विरुद्ध बहु-वापरकर्ता मेमरी विभाजन करणे हे एंटरप्राइझ एजंट तैनातीमधील सर्वात न सुटलेले आव्हान आहे. वैयक्तिक कोडिंग असिस्टंट जो तुमच्या प्रोजेक्टची रचना लक्षात ठेवतो तो ग्राहकासमोर असलेल्या एजंटपेक्षा मूलभूतपणे वेगळा असतो ज्याने डेटा धारणा धोरणांचे पालन करताना हजारो समवर्ती वापरकर्त्यांसाठी स्वतंत्र मेमरी स्थिती राखली पाहिजे.

ओपल अपडेट काय सूचित करते की Google मेमरी हे एजंट आर्किटेक्चरचे मुख्य वैशिष्ट्य मानते, पर्यायी ॲड-ऑन ऐवजी. एजंट प्लॅटफॉर्मचे मूल्यांकन करणाऱ्या IT निर्णय निर्मात्यांसाठी, हे खरेदी निकषांसाठी मार्गदर्शक म्हणून काम करेल. स्पष्ट मेमरी धोरणाशिवाय प्रॉक्सी फ्रेमवर्क हे प्रभावी डेमो तयार करेल परंतु उत्पादनात संघर्ष करेल, कारण प्रॉक्सीचे मूल्य समान वापरकर्ते आणि डेटासेटसह पुनरावृत्ती झालेल्या परस्परसंवादांवर एकत्रित केले जाते.

लूपमध्ये मनुष्य असणे हा फॉलबॅक पर्याय नाही, तो एक डिझाइन नमुना आहे

ओपल अपडेटचा तिसरा स्तंभ Google त्याला म्हणतो "परस्परसंवादी गप्पा" — एजंटची अंमलबजावणी थांबवण्याची क्षमता, वापरकर्त्याला फॉलो-अप प्रश्न विचारणे, गहाळ माहिती गोळा करणे किंवा सुरू ठेवण्यापूर्वी पर्याय प्रदान करणे. एजंट अभियांत्रिकीच्या दृष्टीने, हे लूपमधील मानवी समन्वय आहे आणि ग्राहक उत्पादनामध्ये त्याचा समावेश स्पष्ट आहे.

आज उत्पादनाचे सर्वात प्रभावी एजंट पूर्णपणे स्वतंत्र नाहीत. त्या अशा प्रणाली आहेत ज्यांना माहित आहे की ते त्यांच्या विश्वासाच्या मर्यादेपर्यंत पोहोचले आहेत आणि सुरक्षितपणे एखाद्या व्यक्तीकडे नियंत्रण परत करू शकतात. हा असा नमुना आहे जो विश्वासार्ह एंटरप्राइझ एजंट्सना अशा प्रकारच्या अनियंत्रित स्वायत्त प्रणालींपासून वेगळे करतो ज्याने संपूर्ण उद्योगात सावधगिरीच्या कथा तयार केल्या आहेत.

LangGraph सारख्या फ्रेमवर्कमध्ये, ह्युमन-इन-द-लूप पारंपारिकपणे ग्राफमध्ये एक स्पष्ट नोड म्हणून लागू केले गेले आहे – एक हार्ड-कोडेड चेकपॉईंट जेथे अंमलबजावणी मानवी पुनरावलोकनासाठी थांबते. ओपलचा दृष्टीकोन अधिक लवचिक आहे: एजंटला त्याच्याकडे असलेल्या माहितीची गुणवत्ता आणि पूर्णता यावर आधारित मानवी इनपुटची आवश्यकता असते तेव्हा तो स्वतः ठरवतो. ही अधिक नैसर्गिक परस्परसंवाद शैली आहे आणि अधिक चांगली कार्य करते, कारण त्यासाठी बांधकाम व्यावसायिकाला कुठे मानवी हस्तक्षेप आवश्यक असेल हे आधीच सांगण्याची आवश्यकता नाही.

एंटरप्राइझ वास्तुविशारदांसाठी, धडा असा आहे की लूपमधील मानवाला एजंट तयार केल्यानंतर स्थापित केले जाणारे सुरक्षा जाळे मानले जाऊ नये. ही एजंट फ्रेमवर्कची स्वतःची प्रथम-ऑर्डर क्षमता असावी – ज्याला मॉडेल त्याच्या अनिश्चिततेच्या स्वतःच्या मूल्यांकनावर आधारित गतिशीलपणे कॉल करू शकते.

डायनॅमिक राउटिंग: मॉडेलला मार्ग निर्धारित करण्यास अनुमती द्या

शेवटचे महत्त्वाचे वैशिष्ट्य म्हणजे डायनॅमिक राउटिंग, जिथे निर्माते वर्कफ्लोद्वारे अनेक मार्ग परिभाषित करू शकतात आणि एजंटला सानुकूल निकषांवर आधारित योग्य मार्ग निवडू देतात. Google चे उदाहरण एक कार्यकारी ब्रीफिंग एजंट आहे जो वापरकर्ता नवीन किंवा विद्यमान क्लायंटला भेटत आहे की नाही यावर अवलंबून वेगवेगळे मार्ग स्वीकारतो — एका बाबतीत महत्त्वाच्या माहितीसाठी वेबवर शोधणे, दुसऱ्या बाबतीत अंतर्गत मीटिंग नोट्सचे पुनरावलोकन करणे.

हे वैचारिकदृष्ट्या कंडिशनल ब्रँचिंगसारखे आहे ज्याला LangGraph आणि तत्सम फ्रेमवर्कने काही काळ समर्थन दिले आहे. परंतु ओपल निर्मात्यांना कोडऐवजी नैसर्गिक भाषेत रूटिंग पॅरामीटर्सचे वर्णन करण्याची परवानगी देऊन अडथळा लक्षणीयपणे कमी करते. डेव्हलपरला सुस्पष्ट सशर्त तर्क लिहिण्याची आवश्यकता न ठेवता मॉडेल निकषांचा अर्थ लावते आणि राउटिंग निर्णय घेते.

संस्थेवर होणारे परिणाम लक्षणीय आहेत. नैसर्गिक भाषा मानकांद्वारे समर्थित डायनॅमिक राउटिंग म्हणजे व्यवसाय विश्लेषक आणि डोमेन तज्ञ — केवळ विकासकच नव्हे — जटिल एजंट वर्तन ओळखू शकतात. हे एजंटच्या विकासाला पूर्णपणे अभियांत्रिकी शाखेतून बदलते ज्यामध्ये डोमेन ज्ञान प्राथमिक अडथळे बनते, असा बदल जो गैर-तांत्रिक व्यवसाय युनिट्समध्ये त्याचा अवलंब करण्यास नाटकीयपणे गती देऊ शकतो.

Google खरोखर काय तयार करत आहे: एक ग्राहक बुद्धिमत्ता स्तर

वैयक्तिक वैशिष्ट्यांकडे परत जाताना, ओपल अपडेटमधील विस्तृत नमुना म्हणजे Google एक बुद्धिमत्ता स्तर तयार करत आहे जो वापरकर्त्याचा हेतू आणि जटिल, बहु-चरण कार्यांच्या अंमलबजावणी दरम्यान बसतो. “ब्रेडबोर्ड” नावाच्या अंतर्गत एजंट SDK कडून शिकलेल्या धड्यांवर आधारित, एजंटची पायरी म्हणजे वर्कफ्लोमधील आणखी एक नोड नाही — हा एक ऑर्केस्ट्रेशन स्तर आहे जो मॉडेल्सची भरती करू शकतो, साधने मागवू शकतो, मेमरी व्यवस्थापित करू शकतो, डायनॅमिकली रूट करू शकतो आणि माणसांशी संवाद साधू शकतो, हे सर्व जेमिनी मॉडेलच्या नेहमी-सुधारत असलेल्या अनुमान क्षमतांद्वारे चालवले जाते.

हीच स्थापत्य शैली आहे जी संपूर्ण उद्योगात दिसून आली आहे. अँथ्रोपिकचा क्लॉड कोड, प्रोग्रामिंग कार्ये स्वायत्तपणे रात्रभर व्यवस्थापित करण्याच्या क्षमतेसह, समान तत्त्वांवर अवलंबून आहे: एक सक्षम मॉडेल, साधनांमध्ये प्रवेश, चालू संदर्भ आणि फीडबॅक लूप जे स्वत: ची सुधारणा करण्यास परवानगी देतात. प्लगइन राल्फ व्हिघमने या दृष्टीकोनाला औपचारिक रूप दिले की मॉडेल्सना त्यांच्या स्वत:च्या अपयशातून योग्य समाधानापर्यंत पोहोचवले जाऊ शकते—स्व-सुधारणेची एक क्रूर-फोर्स आवृत्ती जी ओपल आता काही विशिष्ट ग्राहक अनुभवात पॅकेज करत आहे.

एंटरप्राइझ संघांसाठी, मूळ कल्पना अशी आहे की एजंट आर्किटेक्चर एका सामान्य आदिम संचावर एकत्रित होते: लक्ष्य-दिग्दर्शित नियोजन, साधन वापर, पर्सिस्टंट मेमरी, डायनॅमिक रूटिंग आणि मानवी-इन-द-लूप समन्वय. फरक हा नाही की तुम्ही कोणत्या प्रिमिटिव्ह्जची अंमलबजावणी करता, परंतु तुम्ही त्यांना किती चांगल्या प्रकारे समाकलित करता—आणि आवश्यक मॅन्युअल कॉन्फिगरेशनचे प्रमाण कमी करण्यासाठी तुम्ही वर्धित पॅरामेट्रिक मॉडेल्सच्या क्षमतांचा किती प्रभावीपणे लाभ घेता.

एंटरप्राइझ एजंट बिल्डर्ससाठी व्यावहारिक प्लेबुक

Google या क्षमता मोफत, ग्राहकाभिमुख उत्पादनामध्ये पाठवत आहे हे स्पष्ट संदेश पाठवते की प्रभावी AI एजंट तयार करण्यासाठी मूलभूत नमुने यापुढे अत्याधुनिक संशोधन नाहीत. उत्पादित केले जातात. तंत्रज्ञान परिपक्व होण्याची वाट पाहणाऱ्या एंटरप्राइझ संघांकडे आता एक संदर्भ अनुप्रयोग आहे जे ते कोणत्याही खर्चाशिवाय अभ्यास करू शकतात, चाचणी करू शकतात आणि शिकू शकतात.

व्यावहारिक पायऱ्या स्पष्ट आणि सरळ आहेत. प्रथम, तुमचे वर्तमान प्रॉक्सी आर्किटेक्चर अती प्रतिबंधित आहेत की नाही याचे मूल्यांकन करा. प्रत्येक निर्णय बिंदूला एम्बेडेड तर्काची आवश्यकता असल्यास, आपण कदाचित विद्यमान सीमा मॉडेलच्या नियोजन क्षमतांचा फायदा घेत नाही. दुसरे, मुख्य वास्तुशास्त्रीय घटक म्हणून स्मृतीला प्राधान्य द्या, विचार न करता. तिसरे, वर्कफ्लोमध्ये स्थिर चेकपॉईंट ऐवजी एजंट ज्या डायनॅमिक क्षमतेचा वापर करू शकतो अशा मानवी-इन-द-लूपची रचना करा. चौथे, डोमेन तज्ञांना एजंट डिझाइन प्रक्रियेत आणण्याचा एक मार्ग म्हणून नैसर्गिक भाषा मार्गदर्शनाचा शोध घेणे.

ओपल कदाचित संस्थांनी स्वीकारलेले व्यासपीठ बनणार नाही. परंतु त्यांनी मूर्त स्वरुप दिलेले डिझाइन नमुने – अनुकूली, स्मृती-समृद्ध, मानव-जागरूक एजंट्स ज्याला अग्रगण्य मॉडेल्सद्वारे समर्थित केले जाते – हे नमुने आहेत जे एंटरप्राइझ AI च्या पुढील पिढीची व्याख्या करतील. गुगलने हात दाखवला आहे. आयटी नेत्यांसाठी प्रश्न आहे की त्यांना काळजी आहे का.

Source link