आपल्या इनबॉक्सची अधिक हुशार व्हिजन पाहिजे? केवळ संस्था एआय, डेटा आणि सुरक्षा नेत्यांसाठी संबंधित असलेल्या गोष्टी मिळविण्यासाठी आमच्या साप्ताहिक वृत्तपत्रांची सदस्यता घ्या. आता सदस्यता घ्या


सिंगापूरमधील कृत्रिम बुद्धिमत्तेवर आधारित सेपिएंट इंटेलिजेंसने mance म्नेस्टी इंटरनॅशनलची एक नवीन रचना विकसित केली आहे जी जुळू शकते आणि काही प्रकरणांमध्ये मोठ्या एलएलएमएस मॉडेल्स (एलएलएम) जटिल विचारांच्या कार्ये लक्षणीयरीत्या आहेत, सर्व काही डेटामध्ये खूपच लहान आणि कार्यक्षम आहे.

आर्किटेक्चर, हे विशिष्ट मानवी मेंदूत कसे वापरावे याद्वारे प्रेरित नायक -थिंकिंग मॉडेल (एचआरएम) म्हणून ओळखले जाते हळू आणि हेतुपुरस्सर नियोजन आणि अंतर्ज्ञानी जलद खात्यासाठी सिस्टम. आज एलएलएमएसला आवश्यक असलेल्या डेटा आणि मेमरीच्या भागासह मॉडेल प्रभावी परिणाम साध्य करते. या कार्यक्षमतेचा वास्तविक संस्थांसाठी एआय अनुप्रयोगांवर महत्त्वपूर्ण परिणाम होऊ शकतो जेथे डेटा दुर्मिळ आहे आणि अंकगणित संसाधने मर्यादित आहेत.

विचारांच्या विचारांच्या मालिकेच्या सीमा

एखाद्या जटिल समस्येचा सामना करताना, सध्याचे एलएलएम मुख्यत्वे आयडिया मालिका (सीओटी) वर अवलंबून असतात, ज्यामुळे समस्या मध्यम -आधारित मजकूर चरणांमध्ये विभाजित होतात, जे मुख्यत: मॉडेलला “मोठ्याने विचार करण्यास” भाग पाडते कारण ते निराकरणाच्या दिशेने कार्य करते.

सीओटीने एलएलएमएस लॉजिकल क्षमता सुधारित केल्या आहेत, तर त्यात मूलभूत निर्बंध आहेत. त्यांच्या पेपरमध्ये, संशोधकांनी सेपिएंट इंटेलिजन्सवर असा युक्तिवाद केला आहे की “विचारसरणीसाठी कॉट हा एक क्रॅच आहे, एक समाधानकारक समाधान नाही. हे मानवांच्या नाजूक विघटन किंवा ज्ञानावर अवलंबून आहे जेथे एका चरणांवरील गैरवर्तन केल्याने विचार करण्याची प्रक्रिया पूर्णपणे निर्माण होऊ शकते.”


एआय इम्पॅक्ट मालिका सॅन फ्रान्सिस्कोला परत येते – 5 ऑगस्ट

येथे कृत्रिम बुद्धिमत्तेचा पुढील टप्पा – आपण तयार आहात? फाउंडेशनच्या वर्कफ्लो कार्यांमधून स्वतंत्र ऑटोमेशनच्या निर्णयापासून स्वतंत्र एजंट्स कसे रीस्टार्ट करावे याबद्दल विशेष देखावा घेण्यासाठी ब्लॉक, जीएसके आणि एसएपी मधील नेत्यांमध्ये सामील व्हा.

आता आपले स्थान सुनिश्चित करा – जागा मर्यादित आहे: https://bit.ly/3guupff


स्पष्ट भाषेच्या पिढीवरील हे अवलंबन मॉडेल विचार विशिष्ट चिन्हाच्या पातळीवर वाढवते आणि बर्‍याचदा प्रशिक्षण डेटा आणि लांब आणि हळू प्रतिसादांचे उत्पादन आवश्यक असते. हा दृष्टिकोन भाषेत स्पष्टपणे न व्यक्त न करता, आंतरिकरित्या उद्भवणार्‍या “मूळ विचारांच्या” प्रकाराकडे दुर्लक्ष करतो.

“या डेटा आवश्यकता कमी करण्यासाठी अधिक कार्यक्षम दृष्टिकोन आवश्यक आहे.”

मेंदूतून प्रेरित पिरॅमिड दृष्टीकोन

सीओटीला बायपास करण्यासाठी, संशोधक “अंतर्निहित विचार” एक्सप्लोर करतात, जसे की “विचारांची विशिष्ट चिन्हे” तयार करण्याऐवजी, समस्येचे त्यांच्या अमूर्त अंतर्गत प्रतिनिधित्वाची विशिष्ट कारणे. हे मानवांच्या विचारांशी अधिक सुसंगत आहे; पेपरमध्ये असेही म्हटले आहे की, “भाषेत सतत भाषांतर न करता मेंदूत अंतर्निहित जागेत लक्षणीय कार्यक्षमतेसह विचार करण्याच्या दीर्घ सुसंगत साखळ्यांची देखभाल केली जाते.”

तथापि, कृत्रिम बुद्धिमत्तेत या पातळीवरील सखोल तर्क साध्य करणे कठीण आहे. सखोल शिक्षण मॉडेलमध्ये अधिक थरांचे संचय बहुतेक वेळा “फिकट ग्रेडियंट” च्या समस्येस कारणीभूत ठरते, कारण थरांद्वारे शिकण्याचे संकेत, ज्यामुळे प्रशिक्षण कुचकामी होते. खात्यांवर उड्डाण करणारे वैकल्पिक आणि वारंवार रचना “लवकर रॅपप्रोकेंट” पासून ग्रस्त होऊ शकतात, कारण मॉडेल संपूर्ण समस्येचा शोध न घेता एक वेगवान समाधान मिटवते.

मेंदूच्या स्त्रोताच्या संरचनेद्वारे प्रेरित हार्सेस थिंकिंग फॉर्म (एचआरएम): आर्क्सिव्ह

अधिक चांगल्या दृष्टिकोनाचा शोध घेत, सॅपींट टीम सोल्यूशनसाठी न्यूरो सायन्समध्ये बदलला. “समकालीन कृत्रिम मॉडेल्सची कमतरता असलेल्या प्रभावी अंकगणित खोली साध्य करण्यासाठी मानवी मेंदू एक खात्रीशीर योजना प्रदान करते,” संशोधकांचे म्हणणे आहे. “हे कॉर्टिकल क्षेत्रात एक श्रेणीबद्ध खाते आयोजित करते जे वेगवेगळ्या कालावधीत कार्य करते, ज्यामुळे खोल विचारांना खोल विचार करता येतो.”

याद्वारे प्रेरित, त्यांनी एचआरएमची रचना दोन हलगर्जी आणि पुनरावृत्ती युनिट्ससह केली: एचडी (एच) युनिट (एच) हळू आणि अमूर्त नियोजनासाठी आणि वेगवान आणि तपशीलवार गणनेचे लो -लेव्हल (एल) युनिट. ही रचना “श्रेणीबद्ध रॅपप्रोकेंट” द्वारे कॉल केलेल्या प्रक्रियेस सक्षम करते. अंतर्ज्ञानाने, एल आणि फास्ट युनिट समस्येच्या भागावर उपचार करते आणि स्थिर स्थानिक समाधानापर्यंत पोहोचत नाही तोपर्यंत एकाधिक चरणांची अंमलबजावणी करते. या टप्प्यावर, एस स्लोंग युनिट हा परिणाम घेते, त्याची सर्वसमावेशक रणनीती अद्यतनित करते आणि एल आणि युनिट कार्य करण्यासाठी एक नवीन नवीन सब -प्रॉब्लम देते. हे प्रभावीपणे मॉड्यूल रीसेट करीत आहे आणि त्यास अडखळण्यापासून प्रतिबंधित करीत आहे (लवकर रॅपप्रोचमेंट) आणि संपूर्ण सिस्टमला गायब ग्रेडियंट्समुळे ग्रस्त नसलेल्या पातळ मॉडेलच्या संरचनेसह विचार करण्याच्या चरणांची लांबलचक मालिका करण्यास परवानगी देत आहे.

एचआरएम (डावीकडे) गणितांद्वारे द्रावणावर सहजतेने आहे आणि लवकर रॅपप्रोकेंट (मध्यभागी, आरएनएन) टाळते. ग्रेडियंट्स (उजवीकडे, क्लासिक खोल मज्जातंतू नेटवर्क) अदृश्य स्त्रोत: आर्क्सिव्ह

पेपरनुसार, “ही एचआरएम प्रक्रिया अद्वितीय आणि स्थिर परस्पर संबंधित खात्यांच्या मालिकेस अनुमती देते, कारण एच युनिट समस्यांचे निराकरण करण्यासाठी आणि प्रत्येक चरणात आवश्यक असलेल्या गहन शोध किंवा सुधारणेसाठी मॉड्यूल एलची अंमलबजावणी करण्यासाठी निर्देशित करते.” या आच्छादित भागाचे डिझाइन मॉडेलला लांब डेटा किंवा मोठ्या प्रमाणात डेटाची आवश्यकता नसताना त्याच्या मूळ क्षेत्रात सखोल विचार करण्यास अनुमती देते.

नैसर्गिक प्रश्न असा आहे की ही “अंतर्निहित विचार” अर्थ लावण्याच्या क्षमतेच्या खर्चावर येते की नाही. सेपिएंट इंटेलिजेंसचे संस्थापक आणि मुख्य कार्यकारी अधिकारी ग्वान वांग या कल्पनेवर पुन्हा ढकलतात, हे स्पष्ट करते की मॉडेलच्या अंतर्गत ऑपरेशन्सद्वारे मॉडेलचे उल्लंघन केले जाऊ शकते आणि व्हिज्युअलाइझ केले जाऊ शकते, जसे की मॉडेलच्या विचारात कॉटमध्ये खिडकी कशी आहे. हे देखील सूचित करते की सीओ स्वतःच दिशाभूल करणारी असू शकते. वांगने व्हेंचरबीटला सांगितले की, “कॉट खरोखरच मॉडेलचे अंतर्गत तर्कशास्त्र प्रतिबिंबित करत नाही,” असे दर्शविते की मॉडेल कधीकधी चुकीच्या विचारांच्या चरणांची योग्य उत्तरे देऊ शकतात आणि त्याउलट. “हा प्रामुख्याने ब्लॅक बॉक्स आहे.”

एचआरएम विविध गणिताच्या सत्रांद्वारे चक्रव्यूहाच्या समस्येवर कसे कारणीभूत ठरते त्याचे उदाहरण स्त्रोत: आर्क्सिव्ह

कामावर एचआरएम

त्यांच्या मॉडेलची चाचणी घेण्यासाठी, संशोधक मानव संसाधन व्यवस्थापनास मानदंडांविरूद्ध भडकवतात ज्यांना गहन संशोधन आणि कमी होणे आवश्यक आहे, जसे की अ‍ॅबस्ट्रॅक्शन आणि लॉजिक (एआरसी-एजी), सुडोकू कोडी चक्रव्यूह सोडविण्यासाठी खूप कठीण आणि जटिल कामे आहेत.

परिणाम दर्शविते की मानव संसाधन व्यवस्थापन प्रगत एलएलएमसाठी अव्यवहार्य असलेल्या समस्यांचे निराकरण करण्यास शिकते. उदाहरणार्थ, “सुडोकू-एक्स्ट्रिम” आणि “मॅझ-हार्ड” च्या मानकांवर, आधुनिक सीओटी मॉडेल पूर्णपणे अयशस्वी झाले, जिथे त्यांनी 0 % रिझोल्यूशन रेकॉर्ड केले. दुसरीकडे, एचआरएमने केवळ प्रत्येक कार्यासाठी 1000 उदाहरणांवर प्रशिक्षण घेतल्यानंतर जवळजवळ अचूक अचूकता केली आहे.

आर्क-ईजीजी निर्देशांकावर, अमूर्त विचार आणि सामान्यीकरणाची चाचणी, एचआरएम रेकॉर्ड 27 मीटर 40.3 %. हे ओ 3-मिनी-हाय (34.5 %) आणि क्लॉड 3.7 सॉनेट (21.2 %) सारख्या आघाडीच्या सीओटी मॉडेलपेक्षा जास्त आहे. प्रशिक्षणापूर्वी आणि अत्यंत मर्यादित डेटासह प्रशिक्षणाच्या मोठ्या गटाशिवाय साध्य केलेली ही कामगिरी, त्याच्या संरचनेची शक्ती आणि कार्यक्षमता अधोरेखित करते.

एचआरएम जटिल विचारांच्या कार्यांवरील मोठ्या मॉडेल्सला मागे टाकते स्त्रोत: आर्क्सिव्ह

कोडेचे निराकरण मॉडेलची ताकद दर्शवित असताना, जगाचे परिणाम वेगवेगळ्या प्रकारच्या समस्यांमधे पडतात. वांगच्या मते, विकसकांनी भाषा किंवा सर्जनशील कार्यांसाठी एलएलएम वापरणे आवश्यक आहे, परंतु “जटिल किंवा अपरिहार्य कार्यांसाठी”, मानव संसाधन व्यवस्थापनासारखे असलेले आर्किटेक्चर कमी भ्रमांसह उत्कृष्ट कामगिरी प्रदान करते. हे “जटिल निर्णय किंवा दीर्घकालीन नियोजन आवश्यक असलेल्या सिरियल समस्यांचा संदर्भ देते, विशेषत: कृत्रिम बुद्धिमत्ता, मूर्त आणि रोबोट्स किंवा वैज्ञानिक अन्वेषण यासारख्या डेटा श्रेणीतील क्षेत्रांसारख्या जळजळ संवेदनशीलतेच्या क्षेत्रांमध्ये.

या परिस्थितींमध्ये, एचआरएम केवळ समस्या सोडवते; हे अधिक चांगले सोडविणे शिका. “आमच्या सुडोकूच्या मुख्य स्तरावरील अनुभवांमध्ये … मानव संसाधन व्यवस्थापनास हळूहळू प्रशिक्षणासह कमी चरणांची आवश्यकता असते – नवशिक्यासह तज्ञ होण्यासाठी,” वांग यांनी स्पष्ट केले.

संस्थेसाठी, येथेच आर्किटेक्चरची कार्यक्षमता थेट सारांशात भाषांतरित केली जाते. सीरियल पिढी, विशिष्ट सीओटीऐवजी, एचआरएमचा समांतर उपचार वांगने “कार्य पूर्ण करण्याच्या वेळी 100 एक्स वेग वाढवतो” असा अंदाज लावतो. याचा अर्थ तर्क करण्याच्या वेळेमध्ये घट आणि एज डिव्हाइसवर जोरदार विचारसरणी चालविण्याची क्षमता.

खर्च बचत देखील उत्तम आहे. “मानव संसाधन व्यवस्थापनासारखी विशेष विचारसरणी इंजिन मोठ्या, महाग आणि गहन अनुप्रयोग प्रोग्रामिंग इंटरफेस (एपीआय) च्या आधारे मोठ्या मॉडेल्सच्या तुलनेत विशिष्ट जटिल विचारांच्या कार्यांना एक आशादायक पर्याय प्रदान करतात.” कार्यक्षमता त्याच्या योग्य दृष्टीकोनात ठेवण्यासाठी, त्यांनी असे निदर्शनास आणून दिले की व्यावसायिक स्तरावर सुडोकूवरील मॉडेलचे प्रशिक्षण ग्राफिक्स प्रोसेसिंग युनिटचे सुमारे दोन तास लागतात आणि जटिल कमानी-एएटी मानकांसाठी, 50 ते 200 तासांच्या जीपीयू-मोठ्या प्रमाणात मॉडेल्ससाठी आवश्यक असलेल्या संसाधनांचा एक छोटासा भाग. लॉजिस्टिकल सुधारण्यापासून ते जटिल निदानापर्यंत, जेथे डेटा आणि बजेट दोन्ही मर्यादित आहेत अशा विशिष्ट कामाच्या समस्यांचे निराकरण करण्याचा हा एक मार्ग उघडतो.

भविष्याकडे पहात असताना, सेपियंट बुद्धिमत्ता आधीपासूनच विशिष्ट समस्या सोडवण्यापासून अधिक महत्वाच्या विचार युनिटपर्यंत मानव संसाधन व्यवस्थापन विकसित करीत आहे. “आम्ही मानवी संसाधन व्यवस्थापनाच्या आधारे मेंदूत प्रेरित मॉडेल सक्रियपणे विकसित करीत आहोत,” वांग म्हणाले, आरोग्य सेवा आणि हवामान अंदाज आणि रोबोट्सच्या सुरुवातीच्या निकालांवर प्रकाश टाकताना. हे विचलित झाले आहे की या पुढच्या पिढीतील मॉडेल्स आजच्या मजकूर प्रणालींपेक्षा मोठ्या प्रमाणात भिन्न असतील, विशेषत: स्वत: ची काळजी क्षमता समाविष्ट करून.

हे काम सूचित करते की आज कृत्रिम बुद्धिमत्तेच्या दिग्गजांवर अडचणीत आलेल्या समस्यांच्या गटासाठी, मार्ग समोर असू शकत नाही, परंतु अंतिम विचार इंजिनद्वारे प्रेरित अधिक बुद्धिमान आणि अधिक संघटित रचना आहे: मानवी मेंदू.


Source link