उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
डेव्हिड सिल्व्हर आणि रिचर्ड सॉटन, दोन प्रसिद्ध कृत्रिम बुद्धिमत्ता, एका नवीन पेपरमध्ये असा युक्तिवाद करतात की कृत्रिम बुद्धिमत्ता “अनुभवाचा काळ” या नवीन टप्प्यात प्रवेश करणार आहे. येथेच कृत्रिम बुद्धिमत्ता प्रणाली जगातील डेटा गोळा करून आणि त्याशी संवाद साधून एखाद्या व्यक्तीने प्रदान केलेल्या डेटावर कमी अवलंबून असते आणि स्वत: ला सुधारते.
जरी पेपर वैचारिक आणि आकांक्षा आहे, परंतु भविष्यातील कृत्रिम बुद्धिमत्ता एजंट्स आणि सिस्टमसह तयार करण्याचे उद्दीष्ट असलेल्या संस्थांवर त्याचा थेट परिणाम होतो.
कृत्रिम बुद्धिमत्तेच्या भविष्याबद्दल अचूक अंदाज लावण्याच्या व्यस्त रेकॉर्डसह चांदी आणि सट्टन हे दोन्ही अनुभवी शास्त्रज्ञ आहेत. प्राधिकरणाची भविष्यवाणी आज अत्यंत प्रगत कृत्रिम बुद्धिमत्ता प्रणालींमध्ये थेट पाहिली जाऊ शकते. २०१ In मध्ये, सॉटन या मजबुतीकरण शिक्षणाचे प्रणेते, “द बिटर लेस” हा प्रसिद्ध लेख लिहिला, ज्यामध्ये तो असा युक्तिवाद करतो की कृत्रिम बुद्धिमत्तेतील सर्वात मोठी दीर्घकालीन प्रगती मुख्यतः जटिल जटिल क्षेत्र जाणून घेण्याऐवजी सामान्य कारणांसाठी संशोधन आणि शिकण्याच्या पद्धतींसह मोठ्या प्रमाणावर खात्याचा फायदा घेत आहे.
दीपमाइंडमधील एक महान वैज्ञानिक डेव्हिड सिल्व्हर, अल्फागो, अल्फाझेरो आणि अल्फास्टार आणि सखोल शिक्षणातील सर्व महत्त्वपूर्ण कामगिरीचे मोठे योगदान होते. २०२१ मध्ये तो एका कागदाचा सहकारी होता, असा दावा केला की, डिझाइन केलेले आणि डिझाइन केलेले बोनस शिक्षण अत्यंत प्रगत एआय सिस्टम तयार करण्यासाठी पुरेसे आहे.
या दोन संकल्पनांचा एलएलएम मॉडेलचा फायदा होतो. जीपीटी -3 पासून कृत्रिम बुद्धिमत्तेच्या दृश्यावर आक्रमण करणार्या नवीन एलएलएमएस वेव्हमध्ये प्रामुख्याने लेखा खाते आणि मोठ्या प्रमाणात ज्ञान सामावून घेण्यासाठी डेटावर आधारित आहे. डीपसेक-आर 1 सारख्या विचारांच्या मॉडेल्सची नवीनतम लाट, हे सिद्ध केले आहे की मजबुतीकरण शिक्षण आणि एक साधा बोनस संकेत शिकण्यासाठी पुरेसे आहे जटिल विचार कौशल्ये.
अनुभवाचे वय काय आहे?
“अनुभवाचे युग” अलिकडच्या वर्षांत सट्टन आणि सिल्व्हर यांनी ज्या संकल्पनेची चर्चा केली त्याच संकल्पनांवर अवलंबून असते आणि कृत्रिम बुद्धिमत्तेत आधुनिक घडामोडींशी जुळवून घेतात. लेखकांचा असा युक्तिवाद आहे की “आपण केवळ मानवी डेटाचे पर्यवेक्षण करण्यास शिकण्याद्वारे पुढे जाण्याची गती स्पष्टपणे हळू आहे, ज्यामुळे नवीन दृष्टिकोनाची आवश्यकता दर्शविली जाते.”
या दृष्टिकोनासाठी डेटाचा एक नवीन स्त्रोत आवश्यक आहे, जो एजंट अधिक मजबूत असणार्या अशा प्रकारे तयार केला जाणे आवश्यक आहे. “हे एजंट्सना त्यांच्या स्वत: च्या अनुभवावरून सतत शिकण्याची परवानगी देऊन साध्य करता येते, म्हणजेच त्याच्या वातावरणाशी संवाद साधणार्या एजंटने तयार केलेला डेटा,” सट्टन आणि सिल्व्हर लिहितात. त्यांचा असा युक्तिवाद आहे की शेवटी, “हा प्रयोग सुधारण्याचे प्रमुख साधन बनेल आणि अखेरीस आजच्या प्रणालींमध्ये वापरल्या जाणार्या मानवी डेटा स्केलवर मात करेल.”
लेखकांच्या मते, त्यांच्या प्रायोगिक डेटामधून शिकण्याव्यतिरिक्त, भविष्यातील कृत्रिम बुद्धिमत्ता प्रणाली “चार परिमाणांद्वारे मानवांवर लक्ष केंद्रित करणार्या कृत्रिम बुद्धिमत्ता प्रणालींच्या निर्बंधात” प्रवेश करेल “:
- प्रवाह: स्वतंत्र भागांद्वारे काम करण्याऐवजी कृत्रिम बुद्धिमत्ता एजंट्सना “बर्याच काळासाठी मानवांप्रमाणेच त्यांच्या अनुभवांमधून त्यांचा स्वतःचा प्रवाह असेल.” हे एजंट्सना दीर्घकालीन उद्दीष्टे आणि कालांतराने नवीन वर्तनात्मक नमुन्यांसह अनुकूलतेची योजना करण्यास अनुमती देईल. आम्ही कृत्रिम बुद्धिमत्ता प्रणालींमध्ये याचा एक चमक पाहू शकतो ज्यात आपण वापरकर्त्याच्या परस्परसंवादाच्या आधारे सतत अद्यतनित करता अशा खूप लांब विंडोज आणि मेमरी आर्किटेक्चर आहेत.
- प्रक्रिया आणि नोट्स: मानवी प्रक्रिया आणि नोटांवर लक्ष केंद्रित करण्याऐवजी एजंट वास्तविक जगात स्वतंत्रपणे कार्य करतील. याची उदाहरणे म्हणजे एज डीलरशिप जे संगणक वापर आणि मॉडेलच्या संदर्भातील संदर्भ (एमसीपी) यासारख्या साधनांद्वारे बाह्य अनुप्रयोग आणि संसाधनांशी संवाद साधू शकतात.
- बक्षिसे: सध्याची मजबुतीकरण प्रणाली बहुतेकदा मानवी माणसासाठी डिझाइन केलेल्या बोनस फंक्शन्सवर अवलंबून असते. भविष्यात, कृत्रिम बुद्धिमत्ता एजंट्सने त्यांचे डायनॅमिक बक्षीस कार्ये डिझाइन करण्यास सक्षम केले पाहिजे जे कालांतराने अनुकूलित करतात आणि जगातील एजंटच्या कृती आणि निरीक्षणाद्वारे गोळा केलेल्या वास्तविक जगाच्या सिग्नलशी वापरकर्त्याच्या पसंतीशी संबंधित आहेत. आम्ही एनव्हीडियाच्या ड्रेयुरेकासारख्या सिस्टमसह सेल्फ -डिझाइन बक्षिसेच्या सुरुवातीच्या आवृत्त्या पाहतो.
- नियोजन आणि तर्कशास्त्र: सध्याचे विचार मॉडेल मानवी विचारांचे अनुकरण करण्यासाठी डिझाइन केलेले आहेत. लेखकांचा असा युक्तिवाद आहे की “सर्वात कार्यक्षम विचार यंत्रणा निश्चितपणे अस्तित्त्वात आहेत, वापरल्या जाणार्या अमानुष भाषांचा वापर करून, उदाहरणार्थ, प्रतीकात्मक, वितरित, सतत किंवा भेदभावपूर्ण खात्यांचा फायदा घेत.” कृत्रिम बुद्धिमत्ता एजंट्सने जगाशी सामोरे जाणे आवश्यक आहे, विचार प्रक्रियेचे आरोग्य आणि आधुनिकीकरण सत्यापित करण्यासाठी आणि जागतिक मॉडेल विकसित करण्यासाठी डेटाचे परीक्षण करणे आणि वापरणे आवश्यक आहे.
मजबुतीकरण शिक्षणाद्वारे त्यांच्या वातावरणाचे पालन करणारे कृत्रिम बुद्धिमत्ता ग्राहकांची कल्पना नवीन नाही. परंतु पूर्वी, हे एजंट्स टेबल गेम्ससारख्या मर्यादित वातावरणात मर्यादित होते. आज, जटिल वातावरणाशी संवाद साधू शकणारे एजंट (उदाहरणार्थ, कृत्रिम बुद्धिमत्तेचा वापर) आणि मजबुतीकरण शिक्षणात प्रगती या निर्बंधांवर मात करेल, ज्यामुळे अनुभवाच्या युगात संक्रमण होते.
संस्थेचा अर्थ काय आहे?
सट्टन आणि सिल्व्हर पेपरमध्ये बर्न ही एक टीप आहे ज्याचा वास्तविक जगातील अनुप्रयोगांवर महत्त्वपूर्ण परिणाम होईल: “एजंट” कार्यपद्धती आणि नोट्स “मानवी इंटरफेस सारख्या” नोट्स “वापरू शकतो, जे नैसर्गिकरित्या वापरकर्त्यास संप्रेषण आणि सहकार्य सुलभ करते. एजंट एपीआय आणि एपीआयसाठी योग्य असलेल्या “मशीन” च्या कृती देखील करू शकतो, ज्यामुळे एजंटला लक्ष्यच्या क्षेत्रात स्थापित करण्याची परवानगी मिळते.
अनुभवाच्या युगाचा अर्थ असा आहे की विकसकांना केवळ मानवांसाठीच नव्हे तर कृत्रिम बुद्धिमत्ता एजंट्सच्या स्थितीसह त्यांचे अनुप्रयोग तयार करावे लागतील. मशीनच्या अनुकूल प्रक्रियेसाठी सुरक्षित आणि सहज प्रवेश करण्यायोग्य अनुप्रयोग थेट किंवा एमसीपीसारख्या दर्शनी भागांद्वारे तयार करणे आवश्यक आहे. याचा अर्थ असा आहे की Google च्या एजंट 2 एजंट सारख्या प्रोटोकॉलद्वारे शोधले जाऊ शकते असे एजंट तयार करणे. कार्यपद्धती आणि नोट्स दोन्हीमध्ये प्रवेश प्रदान करण्यासाठी आपल्याला अनुप्रयोग दर्शनी आणि एजन्सी डिझाइन करणे देखील आवश्यक आहे. हे एजंट हळूहळू आपल्या अनुप्रयोगांसह त्यांचे संवाद विचार करतील आणि शिकतील.
जर सट्टन आणि चांदीची सध्याची दृष्टी प्रत्यक्षात आली तर लवकरच कार्ये पूर्ण करण्यासाठी अब्जावधी एजंट वेबवर (आणि लवकरच भौतिक जगात) भटकंती करतील. त्यांचे वर्तन आणि गरजा मानवी वापरकर्त्यांपेक्षा आणि विकसकांपेक्षा पूर्णपणे भिन्न असतील आणि त्यांच्या अनुप्रयोगाशी संवाद साधण्याचा त्यांच्याकडे मित्राचा मैत्रीपूर्ण मार्ग असेल ज्यामुळे भविष्यातील कृत्रिम बुद्धिमत्ता प्रणालींचा फायदा होण्याची आपली क्षमता सुधारेल (तसेच नुकसान होऊ शकते ज्यामुळे ते होऊ शकतात).
“आरएलच्या पायाभूत गोष्टींवर आधारित आणि या नवीन युगातील आव्हानांसह त्याची मूलभूत तत्त्वे रुपांतरित करून आम्ही स्वतंत्र शिक्षणाची संपूर्ण क्षमता उघडू शकतो आणि खरोखर सुपर इंटेलिजेंसचा मार्ग मोकळा करू शकतो,” सट्टन आणि चांदी लिहितात.
दीपमिंडने कथेसाठी अतिरिक्त टिप्पण्या देण्यास नकार दिला.
Source link
















