शुभम साबू, Google चे वरिष्ठ AI उत्पादन व्यवस्थापक, एजंट डिझाइनमधील सर्वात काटेरी समस्यांपैकी एक ओपन सोर्स अभियांत्रिकी व्यायामामध्ये बदलले आहे: सतत मेमरी.
या आठवड्यात, त्यांनी अधिकृत Google क्लाउड प्लॅटफॉर्म गिथब पृष्ठावर “ऑलवेज ऑन मेमरी एजंट” नावाचे एक मुक्त स्त्रोत पुस्तक प्रकाशित केले आहे, ज्यात MIT कडून व्यावसायिक वापरास परवानगी आहे.
हे Google चे एजंट डेव्हलपमेंट किट, किंवा ADK, 2025 मध्ये गेल्या वसंत ऋतूमध्ये सादर केले आणि जेमिनी 3.1 फ्लॅश-लाइट वापरून तयार केले गेले आहे, हे कमी किमतीचे मॉडेल जे Google ने 3 मार्च 2026 रोजी वेगवान, अधिक किफायतशीर जेमिनी 3 मालिका मॉडेल म्हणून सादर केले.
हा प्रकल्प अनेक AI संघांना हव्या असलेल्या गोष्टीची व्यावहारिक संदर्भ अंमलबजावणी आहे परंतु काहींनी स्वच्छपणे उत्पादन केले आहे: एक एजंट प्रणाली जी माहिती सतत अंतर्भूत करू शकते, पार्श्वभूमीत समाकलित करू शकते आणि पारंपारिक वेक्टर डेटाबेसवर अवलंबून न राहता नंतर ती पुनर्प्राप्त करू शकते.
एंटरप्राइझ डेव्हलपर्ससाठी, रिलीझ उत्पादन लॉन्च म्हणून कमी आणि एजंट इन्फ्रास्ट्रक्चर कोणत्या दिशेने जात आहे याबद्दल सिग्नल म्हणून अधिक महत्त्वाचे आहे.
रेपो प्रणालीमध्ये दीर्घकालीन स्वायत्ततेचे दृश्य समाविष्ट आहे जे समर्थन प्रणाली, संशोधन सहाय्यक, अंतर्गत सह-वैमानिक आणि वर्कफ्लो ऑटोमेशनसाठी अधिकाधिक आकर्षक होत आहे. एकदा स्मृती सत्राशी निगडीत राहणे बंद झाल्यावर ते प्रशासनाचे प्रश्न अधिक स्पष्टपणे हायलाइट करते.
रेपो काय करते असे दिसते – आणि ते स्पष्टपणे काय दावा करत नाही
रेपो एक मल्टी-एजंट अंतर्गत आर्किटेक्चर वापरत असल्याचे दिसते, विशेष घटक जे अंतर्ग्रहण, विलीनीकरण आणि क्वेरी हाताळतात.
परंतु उपलब्ध साहित्य हे अनेक स्वायत्त एजंट्सच्या सामायिक मेमरीसाठी एक फ्रेमवर्क आहे या व्यापक दाव्याला स्पष्टपणे पुष्टी देत नाही.
हा फरक महत्त्वाचा आहे. फ्रेमवर्क म्हणून ADK मल्टी-एजंट सिस्टमला समर्थन देते, परंतु या विशिष्ट रेपोचे वर्णन नेहमी-ऑन मेमरी एजंट किंवा मेमरी लेयर म्हणून केले जाते, विशेष उप-एजंट आणि सतत स्टोरेज.
या संकुचित स्तरावरही, ते मूलभूत पायाभूत सुविधांच्या समस्येचे निराकरण करते ज्यावर अनेक संघ कार्य करत आहेत.
आर्किटेक्चर पारंपारिक लूपबॅक स्टॅकपेक्षा साधेपणाचे समर्थन करते
रेपॉजिटरीवर अवलंबून, एजंट सतत चालतो, फाइल्स किंवा API इनपुट अंतर्भूत करतो, SQLite मध्ये संरचित मेमरी संग्रहित करतो आणि डीफॉल्टनुसार प्रत्येक 30 मिनिटांनी शेड्यूल्ड मेमरी मर्ज करतो.
मूळ HTTP API आणि Streamlit नियंत्रण पॅनेल समाविष्ट केले आहे आणि सिस्टम मजकूर, प्रतिमा, ऑडिओ, व्हिडिओ आणि PDF फायली अंतर्भूत करण्यास समर्थन देते. रेपो डिझाइनला जाणीवपूर्वक उत्तेजक दाव्यासह फ्रेम करते: “कोणताही वेक्टर डेटाबेस नाही. एम्बेडिंग नाही. फक्त एक LLM जो संरचित मेमरी वाचतो, विचार करतो आणि लिहितो.”
ही डिझाइन निवड खर्च आणि ऑपरेशनल जटिलता व्यवस्थापित करणाऱ्या विकासकांचे लक्ष वेधून घेईल. पारंपारिक पुनर्प्राप्ती स्टॅकमध्ये अनेकदा एम्बेडिंग, वेक्टर स्टोरेज, इंडेक्सिंग लॉजिक आणि सिंक्रोनाइझेशन कामासाठी स्वतंत्र पाइपलाइन आवश्यक असतात.
त्याऐवजी, साबू उदाहरण थेट मेमरी व्यवस्थित आणि अपडेट करण्यासाठी मॉडेलवर अवलंबून आहे. व्यवहारात, हे प्रोटोटाइपिंग सुलभ करू शकते आणि पायाभूत सुविधांचा विस्तार कमी करू शकते, विशेषत: लहान किंवा मध्य-मेमरी एजंट्ससाठी. हे कार्यप्रदर्शन प्रश्नाला वेक्टर शोधाच्या ओव्हरहेडमधून मॉडेल लेटन्सी, मेमरी कॉम्प्रेशन लॉजिक आणि दीर्घकालीन वर्तणूक स्थिरतेकडे देखील हलवते.
Flash-Lite नेहमी चालू असलेल्या मॉडेलला काही आर्थिक तर्क देते
इथेच मिथुन ३.१ फ्लॅश-लाइट कथेत प्रवेश करतो.
Google म्हणते की हे मॉडेल मोठ्या प्रमाणात विकासक वर्कलोडसाठी डिझाइन केले आहे आणि त्याची किंमत प्रति दशलक्ष इनपुट कोड $0.25 आणि प्रति दशलक्ष आउटपुट कोड $1.50 आहे.
कंपनीने असेही म्हटले आहे की फ्लॅश-लाइट हे पहिल्या टोकनच्या वेळेत जेमिनी 2.5 फ्लॅशपेक्षा 2.5 पट वेगवान आहे आणि समान किंवा चांगली गुणवत्ता राखून आउटपुट गतीमध्ये 45% वाढ प्रदान करते.
Google च्या प्रकाशित बेंचमार्कमध्ये, मॉडेलने Arena.ai वर 1432 चा Elo स्कोअर, GPQA डायमंडवर 86.9% आणि MMMU Pro वर 76.8% स्कोअर केला आहे. Google ही वैशिष्ट्ये भाषांतर, नियंत्रण, UI निर्मिती आणि सिम्युलेशन यांसारख्या उच्च-वारंवारता कार्यांसाठी योग्य म्हणून ठेवते.
फ्लॅश-लाइट पार्श्वभूमी मेमरी घटकासह का जोडले जाते हे स्पष्ट करण्यात हे आकडे मदत करतात. 24/7 सेवा जी वेळोवेळी पुन्हा वाचते, विलीन करते आणि सेवा मेमरी “नेहमी चालू” महाग होऊ नये म्हणून अंदाज लावता येण्याजोगा विलंब आणि कमी अनुमान खर्चाची आवश्यकता असते.
Google ADK दस्तऐवजीकरण व्यापक कथेला बळकटी देते. फ्रेमवर्क मॉडेल-अज्ञेयवादी आणि उपयोजन-अज्ञेयवादी म्हणून सादर केले आहे, वर्कफ्लो एजंट, मल्टी-एजंट सिस्टम, टूल्स आणि क्लाउड रन आणि व्हर्टेक्स एआय एजंट इंजिनसह मूल्यांकन आणि उपयोजन लक्ष्यांसाठी समर्थन आहे. हे संयोजन मेमरी एजंटला एक-वेळच्या डेमोसारखे कमी आणि विस्तृत एजंट रनटाइम धोरणासाठी संदर्भ बिंदूसारखे बनवते.
संस्थांबाबतचा वाद हा केवळ क्षमतेचा नसून कारभाराचा आहे
सार्वजनिक प्रतिक्रिया दर्शविते की उपक्रमांनी केवळ गती किंवा टोकन किंमतीवर सतत मेमरीवर अवलंबून का राहू नये.
X ला दिलेल्या अनेक प्रतिसादांनी एंटरप्राइझ आर्किटेक्ट वाढवण्याची शक्यता असलेल्या चिंतेवर प्रकाश टाकला. फ्रँक ॲबे यांनी Google च्या ADK आणि 24/7 मेमरी एकत्रीकरणाचे वर्णन “सतत एजंट स्वायत्ततेसाठी विलक्षण झेप” असे केले, परंतु चेतावणी दिली की एजंट “स्वप्न पाहणे” आणि पार्श्वभूमीत निर्धारवादी मर्यादेशिवाय आठवणींची देवाणघेवाण करणे हे “अनुपालन दुःस्वप्न” बनते.
ELED द्वारे एक संबंधित मुद्दा बनवला गेला, ज्याने असा युक्तिवाद केला की शाश्वत एजंट्सची मुख्य किंमत टोकन नसून “ड्रिफ्ट आणि लूप” आहे.
या टीका थेट पर्सिस्टंट सिस्टमच्या ऑपरेशनल ओझ्याकडे जातात: मेमरी कोण लिहू शकते, काय विलीन केले जाते, आठवणी कशा जतन केल्या जातात, आठवणी कधी हटवल्या जातात आणि एजंटने कालांतराने काय शिकले आहे याचे पुनरावलोकन कार्यसंघ कसे करतात?
इफ्फीच्या दुसऱ्या प्रतिक्रियेने, “नॉन-इन्क्लुजन” रेपो फ्रेमवर्कला आव्हान दिले, असा युक्तिवाद केला की सिस्टमला अद्याप विभाजन, अनुक्रमणिका आणि संरचित मेमरी पुनर्प्राप्त करणे आवश्यक आहे आणि ते लहान संदर्भ क्लायंटसह चांगले कार्य करू शकते परंतु मेमरी स्टोअर्स खूप मोठे झाल्यावर ते खंडित होते.
ही टीका तांत्रिक दृष्टिकोनातून महत्त्वाची आहे. वेक्टर डेटाबेस काढून टाकल्याने पुनर्प्राप्ती डिझाइन काढले जात नाही; जटिलता जिथे राहते तिथे ते बदलते.
डेव्हलपर्ससाठी, विचारधारेबद्दल कमी आणि सोयीबद्दल अधिक आहे. एक हलका स्टॅक मर्यादित मेमरी आणि कमी किमतीच्या एजंट्ससाठी आकर्षक असू शकतो, तर मोठ्या प्रमाणावरील उपयोजनांना अजूनही कठोर पुनर्प्राप्ती नियंत्रणे, तीक्ष्ण अनुक्रमणिका धोरणे आणि मजबूत जीवनचक्र साधनांची आवश्यकता असू शकते.
ADK कथा एका डेमोच्या पलीकडे विस्तृत करते
इतर टिप्पणीकारांनी विकासकाच्या कार्यप्रवाहावर लक्ष केंद्रित केले. कोणीतरी ADK रेपॉजिटरी आणि दस्तऐवजीकरणाबद्दल विचारले आणि रनटाइम सर्व्हरलेस किंवा दीर्घकाळ चालणारा आहे का आणि टूल आणि मूल्यमापन कॉल हुक बॉक्सच्या बाहेर उपलब्ध आहेत का हे जाणून घ्यायचे होते.
उपलब्ध सामग्रीच्या आधारे, उत्तर प्रभावीपणे दोन्ही आहे: मेमरी एजंट उदाहरण स्वतः दीर्घकाळ चालणारी सेवा म्हणून संरचित आहे, तर ADK अधिक व्यापकपणे एकाधिक तैनाती नमुन्यांचे समर्थन करते आणि त्यात साधने आणि मूल्यमापन क्षमता समाविष्ट आहेत.
नेहमी चालू असलेला मेमरी एजंट स्वतःमध्येच मनोरंजक आहे, परंतु सर्वात मोठा संदेश असा आहे की साबू एजंटना वेगळ्या दाव्यांऐवजी तैनात करण्यायोग्य सॉफ्टवेअर सिस्टमसारखे वाटू देण्याचा प्रयत्न करीत आहे. या फ्रेमवर्कमध्ये, मेमरी रनटाइम लेयरचा भाग बनते, फक्त अतिरिक्त वैशिष्ट्य नाही.
साबूने काय दाखवले – आणि काय केले नाही
साबूने अजून काय दाखवायचे आहे हे त्याने जे प्रकाशित केले आहे तेवढेच महत्त्वाचे आहे.
प्रदान केलेल्या सामग्रीमध्ये उत्पादन वापरात प्रॉक्सी लूपसाठी अँथ्रोपिक क्लॉड हायकू विरुद्ध थेट फ्लॅश-लाइट बेंचमार्किंग समाविष्ट नाही.
हे या मेमरी घटकासाठी एंटरप्राइझ-व्यापी अनुपालन नियंत्रणे देखील स्थापित करत नाही, जसे की निर्धारवादी धोरण मर्यादा, धारणा हमी, विभक्त नियम किंवा औपचारिक ऑडिट वर्कफ्लो.
रेपो अंतर्गत अनेक विशेषीकृत प्रॉक्सी वापरत असल्याचे दिसत असताना, सामग्री अनेक स्वतंत्र प्रॉक्सींमध्ये सामायिक केलेल्या कायमस्वरूपी मेमरीबद्दलचा मोठा दावा स्पष्टपणे सिद्ध करत नाही.
सध्या, रेपोला संपूर्ण एंटरप्राइझ मेमरी प्लॅटफॉर्म ऐवजी प्रच्छन्न आर्किटेक्चर टेम्पलेट म्हणून पाहिले जाते.
हे आता महत्वाचे का आहे?
तथापि, प्रकाशन योग्य वेळी येते. एंटरप्राइझ एआय टीम्स एकाकी सहाय्यकांच्या पलीकडे जाऊन प्राधान्ये लक्षात ठेवणे, प्रकल्प संदर्भ राखणे आणि दीर्घ क्षितिजांवर ऑपरेट करणे अपेक्षित असलेल्या सिस्टमकडे जात आहेत.
साबूने विकसित केलेली ओपन सोर्स मेमरी प्रॉक्सी पायाभूत सुविधांच्या पुढील स्तरासाठी एक ठोस प्रारंभ बिंदू प्रदान करते आणि फ्लॅश-लाइट अर्थव्यवस्थेला काही विश्वासार्हता देते.
परंतु प्रक्षेपणाच्या सभोवतालच्या प्रतिक्रियांमधून सर्वात मजबूत टेकवे म्हणजे कायमस्वरूपी स्मरणशक्ती व्यवस्थापनावर जितकी क्षमता आहे तितकीच न्यायची आहे.
साबू डेमोमागील हाच खरा एंटरप्राइझ प्रश्न आहे: एजंट लक्षात ठेवू शकतो की नाही, परंतु उत्पादनावर विश्वास ठेवण्याइतपत मर्यादित, निरीक्षण करण्यायोग्य आणि सुरक्षित राहण्याच्या मार्गांनी तो लक्षात ठेवू शकतो का.
















