अलीकडेपर्यंत, एआय एजंट्स बनवण्याचा सराव म्हणजे तीस-सेकंद स्मृती असलेल्या लांब पल्ल्याच्या धावपटूला प्रशिक्षण देण्यासारखे होते.
होय, तुम्ही तुमची AI मॉडेल्सची साधने आणि सूचना देऊ शकता, परंतु काही डझन परस्परसंवादानंतर — ट्रॅकभोवती काही लॅप्स, आमचे धावणारे साधर्म्य वाढवण्यासाठी — ते अपरिहार्यपणे संदर्भ गमावतील आणि भ्रमित होऊ लागतील.
OpenAI च्या Responses API मधील नवीनतम अद्यतनांसह – एक API जे OpenAI प्लॅटफॉर्मवरील विकसकांना एकाच कॉलसह वेब शोध आणि फाइल शोध यासारख्या एकाधिक प्रॉक्सी साधनांमध्ये प्रवेश करण्यास अनुमती देते – कंपनी संकेत देते की मर्यादित प्रॉक्सीचे वय कमी होत आहे.
आज घोषित केलेल्या अद्यतनांमध्ये सर्व्हर-साइड कॉम्प्रेशन, होस्ट केलेले शेल कंटेनर आणि समाविष्ट आहे "कौशल्ये" एजंटसाठी मानक.
या तीन प्रमुख अपडेट्ससह, OpenAI प्रभावीपणे एजंट्सना कायमस्वरूपी डेस्क, एक टर्मिनल आणि एक स्मृती देते जी कमी होत नाही आणि एजंटना दीर्घकालीन विश्वासार्ह डिजिटल कामगार म्हणून विकसित होण्यास मदत करते.
तंत्रज्ञान: “संदर्भ स्मृतिभ्रंश” वर मात करणे
स्वतंत्र एजंटांसाठी सर्वात महत्त्वाचा तांत्रिक अडथळा नेहमीच राहिला आहे "गोंधळ" दीर्घकालीन कामांची. प्रत्येक वेळी एजंट एखादे साधन कॉल करतो किंवा स्क्रिप्ट चालवतो तेव्हा संभाषणाचा इतिहास वाढतो.
अखेरीस, मॉडेल त्याच्या टोकन मर्यादेपर्यंत पोहोचते, आणि विकसकाला रेकॉर्ड तोडण्यास भाग पाडले जाते — अनेकदा तेच टोकन हटवले जाते "तर्कशास्त्र" एजंटने काम पूर्ण करणे आवश्यक आहे.
OpenAI चे उत्तर सर्व्हर-साइड कॉम्प्रेशन आहे. साध्या ट्रंकेशनच्या विपरीत, कॉम्प्रेशन एजंटना तास किंवा अगदी दिवस काम करण्यास अनुमती देते.
ई-कॉमर्स प्लॅटफॉर्म ट्रिपल व्हेलचा प्रारंभिक डेटा सूचित करतो की हे एक स्थिरता प्रगती दर्शवते: त्यांच्या एजंटने, मोबीने अचूकता कमी न करता 5 दशलक्ष टोकन आणि 150 इन्स्ट्रुमेंट कॉल्सचा समावेश असलेले सत्र यशस्वीरित्या पार केले.
व्यावहारिक दृष्टीने, याचा अर्थ असा आहे की मॉडेल यास सक्षम आहे "सारांश" त्याच्या भूतकाळातील कृती संकुचित अवस्थेत आहेत, आवाज काढून टाकताना अंतर्निहित संदर्भ जिवंत ठेवतात. हे विस्मरणीय सहाय्यकापासून मॉडेलला सतत सिस्टम प्रक्रियेत बदलते.
व्यवस्थापित क्लाउड सँडबॉक्सेस
शेल टूलचा परिचय OpenAI ला मॅनेज्ड कॉम्प्युटिंगच्या जगात आणते. विकसक आता निवडू शकतात container_auto, जे OpenAI द्वारे होस्ट केलेले डेबियन 12 वातावरण प्रदान करते.
हे फक्त कोड कंपाइलर नाही: ते प्रत्येक एजंटला त्याचे स्वतःचे पूर्ण टर्मिनल वातावरण देते, यासह प्री-लोड केलेले:
-
मूळ अंमलबजावणी वातावरण Python 3.11, Node.js 22, Java 17, Go 1.23, आणि Ruby 3.1 सह.
-
सतत स्टोरेज द्वारे
/mnt/dataएजंटना आयटम तयार करण्यास, जतन करण्यास आणि डाउनलोड करण्यास अनुमती देते. -
नेटवर्किंग क्षमता जे एजंटना लायब्ररी स्थापित करण्यासाठी किंवा तृतीय-पक्ष API सह संवाद साधण्यासाठी इंटरनेटवर प्रवेश करण्यास अनुमती देतात.
होस्ट केलेले शेल आणि त्याची सातत्य /mnt/data स्टोरेज एक व्यवस्थापित वातावरण प्रदान करते जेथे एजंट प्रत्येक AI प्रोजेक्टसाठी कस्टम ETL (एक्स्ट्रॅक्ट, ट्रान्सफॉर्म, लोड) मिडलवेअर तयार आणि राखण्यासाठी टीमला आवश्यक न ठेवता पायथन किंवा जावा वापरून जटिल डेटा ट्रान्सफॉर्मेशन करू शकतात.
या होस्ट केलेल्या कंटेनरचा फायदा घेऊन, डेटा अभियंते डेटा आकार कमी करताना उच्च-कार्यक्षमता डेटा प्रोसेसिंग कार्ये करू शकतात. "अनेक जबाबदाऱ्या" जे कस्टम इन्फ्रास्ट्रक्चर मॅनेजमेंटसह येते, बिल्ड ओव्हरहेड काढून टाकणे आणि त्यांचे स्वतःचे सँडबॉक्स सुरक्षित करणे. OpenAI मुळात म्हणतो: “आम्हाला सूचना द्या, आणि आम्ही तुम्हाला संगणक मिळवून देऊ.”
ओपनएआय कौशल्ये विरुद्ध मानवी कौशल्ये
ओपनएआय एका एकीकृत एजंट समन्वय संचाच्या दिशेने धावत असताना, त्याला अँथ्रोपिकच्या एजंट कौशल्यांच्या प्रमुख तात्विक आव्हानाचा सामना करावा लागतो.
दोन कंपन्यांनी विलक्षण समान फाइल आर्किटेक्चरवर एकत्र केले आहे – वापरून a SKILL.md (मार्केटिंग) YAML च्या अग्रभागी स्पष्ट आहे – परंतु त्याच्या अंतर्निहित रणनीती व्यवसायाच्या भविष्याबद्दल भिन्न दृष्टीकोन प्रकट करतात.
OpenAI दृष्टिकोन प्राधान्य देतो "प्रोग्राम करण्यायोग्य सब्सट्रेट" विकसक गतीसाठी ऑप्टिमाइझ केलेले. प्रतिसाद API मध्ये शेल, मेमरी आणि कौशल्ये एकत्रित करून, ते प्रदान करते "टर्नकी" कॉम्प्लेक्स एजंट तयार करण्याचा त्वरीत अनुभव घ्या.
आधीच, AI संशोधन स्टार्टअप ग्लेननने OpenAI कौशल्य फ्रेमवर्क वापरून टूल अचूकतेमध्ये 73% वरून 85% पर्यंत वाढ नोंदवली आहे.
याउलट, Anthropic ने क्लायंट स्किल्स एक स्वतंत्र ओपन स्टँडर्ड म्हणून जारी केले आहेत (agentskills.io).
ओपनएआय प्रणाली त्याच्या क्लाउड इन्फ्रास्ट्रक्चरमध्ये जवळून समाकलित केलेली असताना, अँथ्रोपिकची कौशल्ये सुलभ पोर्टेबिलिटीसाठी डिझाइन केलेली आहेत. क्लॉडसाठी तयार केलेले कौशल्य सैद्धांतिकदृष्ट्या व्हीएस कोड, कर्सर किंवा विनिर्देशनाचे समर्थन करणाऱ्या इतर कोणत्याही प्लॅटफॉर्मवर पोर्ट केले जाऊ शकते.
खरं तर, नवीन ओपन सोर्स एआय एजंट ओपनक्लॉने याचा अवलंब केला आहे SKILL.md विधान आणि फोल्डर-आधारित पॅकेजिंग, जे मूळतः क्लॉडसाठी डिझाइन केलेले विशेष प्रक्रियात्मक ज्ञानाचे संपत्ती मिळवू देते.
या स्थापत्य समरसतेने समाजाचे पोषण केले आहे "कौशल्याची भरभराट" ClawHub सारख्या प्लॅटफॉर्मवर, जे आता स्मार्ट होम इंटिग्रेशन्सपासून जटिल एंटरप्राइझ वर्कफ्लो ऑटोमेशनपर्यंतचे 3,000 हून अधिक समुदाय विस्तार होस्ट करते.
हे क्रॉस-परागण हे दर्शवते "कौशल्य" हे विक्रेता-लॉक केलेल्या वैशिष्ट्याऐवजी पोर्टेबल मालमत्ता आणि रिलीझ बनते. कारण OpenClaw एकाधिक मॉडेल्सना समर्थन देते — OpenAI ची GPT-5 मालिका आणि मूळ लामा उदाहरणांसह — विकासक आता एक कौशल्य एकदा लिहू शकतात आणि एजंट्सच्या विविध संचामध्ये ते तैनात करू शकतात.
तांत्रिक निर्णय घेणाऱ्यांसाठी, हे खुले मानक बाह्यकरण आणि सामायिकरणासाठी उद्योगाच्या पसंतीच्या मार्गात बदलत आहे. "प्रॉक्सी ज्ञान," मालकी हक्कांच्या पलीकडे सामायिक, तपासणी करण्यायोग्य आणि इंटरऑपरेबल इन्फ्रास्ट्रक्चरकडे जा.
पण OpenAI आणि Anthropic मध्ये आणखी एक महत्त्वाचा फरक आहे "कौशल्ये"
OpenAI दीर्घकाळ चालणाऱ्या सत्राची सक्रिय स्थिती व्यवस्थापित करण्यासाठी सर्व्हर-साइड कॉम्प्रेशन वापरते. एन्थ्रोपिक प्रोग्रेसिव्ह डिटेक्शनचा वापर करते, एक तीन-स्तरीय प्रणाली जिथे मॉडेलला सुरुवातीला फक्त कौशल्याची नावे आणि वर्णनांची माहिती असते.
पूर्ण तपशील आणि सहाय्यक स्क्रिप्ट फक्त तेव्हाच लोड केल्या जातात जेव्हा कार्यासाठी विशेषतः त्याची आवश्यकता असते. हे मॉडेलच्या कार्यशील मेमरीला जबरदस्त न करता – ब्रँड मार्गदर्शक तत्त्वे, कायदेशीर चेकलिस्ट, कोड टेम्पलेट्स – मोठ्या कौशल्य लायब्ररींना परवानगी देते.
संस्थेतील तांत्रिक निर्णय निर्मात्यांसाठी परिणाम
अभियंत्यांसाठी लक्ष केंद्रित करा "जलद उपयोजन आणि उत्कृष्ट ट्यूनिंग," कॉम्प्रेशन आणि सर्व्हर-साइड कौशल्यांचे संयोजन उत्पादकतेमध्ये प्रचंड वाढ प्रदान करते
प्रत्येक एजंट चालविण्यासाठी सानुकूल राज्य व्यवस्थापन तयार करण्याऐवजी, अभियंते अनेक तास लागणाऱ्या कार्ये हाताळण्यासाठी अंगभूत कॉम्प्रेशनचा लाभ घेऊ शकतात.
कौशल्ये यास अनुमती देतात "पॅकेज केलेला आयपी," विशिष्ट प्रक्रियात्मक ज्ञान किंवा विशेष प्रक्रियात्मक ज्ञान मॉड्यूलमध्ये विभागले जाऊ शकते आणि विविध अंतर्गत प्रकल्पांमध्ये पुन्हा वापरले जाऊ शकते.
फाईलमधून AI हस्तांतरित करण्याचे काम सोपवलेल्यांसाठी "चॅट बॉक्स" उत्पादन-स्तरीय वर्कफ्लोपर्यंत – OpenAI घोषणा समाप्ती चिन्हांकित करते "समर्पित पायाभूत सुविधा" युग
ऐतिहासिकदृष्ट्या, प्रॉक्सी ऑर्केस्ट्रेशनसाठी महत्त्वपूर्ण मॅन्युअल स्कॅफोल्डिंग आवश्यक आहे: विकासकांना लांब संभाषणे हाताळण्यासाठी आणि कोडच्या अंमलबजावणीसाठी सुरक्षित, क्षणभंगुर सँडबॉक्सेस प्रदान करण्यासाठी सानुकूल राज्य व्यवस्थापन तर्क तयार करावा लागला.
आव्हान आता राहिलेले नाही "मी या एजंटला टर्मिनल कसे देऊ?" पण "कोणत्या वापरकर्त्यांसाठी कोणती कौशल्ये अनुमत आहेत?" आणि "होस्ट केलेल्या फाइल सिस्टममध्ये तयार केलेल्या कलाकृतींचे आम्ही ऑडिट कसे करू?" OpenAI ने इंजिन आणि आर्किटेक्चर प्रदान केले. आता रस्त्याचे नियम ठरवणे हे समन्वयकाचे काम आहे.
सुरक्षा ऑपरेशन्स (SecOps) व्यवस्थापकांसाठी, एआय मॉडेलला शेल आणि नेटवर्क ऍक्सेस देणे हा एक उच्च जोखमीचा विकास आहे. डोमेन गुपिते आणि परवानगी देणाऱ्या सूचींचा OpenAI चा वापर संस्थांना संरक्षण-सखोल धोरण प्रदान करते, हे सुनिश्चित करते की एजंट संदर्भ तयार करण्यासाठी कच्ची क्रेडेन्शियल उघड न करता APIs कॉल करण्यास सक्षम आहेत.
परंतु जेव्हा एजंट तैनात करणे सोपे होते … "कौशल्य," SecOps बद्दल दक्ष राहणे आवश्यक आहे "दुर्भावनापूर्ण कौशल्ये" ज्यामुळे स्पॉट इंजेक्शन भेद्यता किंवा अनधिकृत डेटा एक्सफिल्टेशनचे मार्ग होऊ शकतात.
कंपन्यांनी कसे ठरवावे?
OpenAI आता फक्त विक्रीसाठी नाही "मेंदू" (फॉर्म); तो विकत आहे "कार्यालय" (कंटेनर), "स्मृती" (दबाव), आणि "प्रशिक्षण मार्गदर्शक" (कौशल्य). संघटनात्मक नेत्यांसाठी, निवड स्पष्ट आहे:
-
दीर्घकालीन फ्रीलान्स कामासाठी तुम्हाला एकात्मिक, हाय-स्पीड वातावरणाची आवश्यकता असल्यास OpenAI निवडा.
-
तुमच्या संस्थेला पॅराडाइम-लेस पोर्टेबिलिटी आणि ओपन इकोसिस्टम मानक आवश्यक असल्यास अँथ्रोपिक निवडा.
शेवटी, घोषणा सूचित करतात, AI चॅट बॉक्समधून सिस्टम आर्किटेक्चरकडे जात आहे आणि बदलत आहे "जलद स्पेगेटी" देखरेख करण्यायोग्य, सोडण्यायोग्य आणि वाढवता येण्याजोग्या व्यवसाय कार्यप्रवाहात.
















