सुमारे दोन दशकांपासून संस्थांच्या नेत्यांवर विश्वास ठेवण्यात आलेल्या कार्यक्रमात सामील व्हा. व्हीबी ट्रान्सफॉर्म जे लोक एकत्र करतात जे वास्तविक संस्थांसाठी एआयची रणनीती तयार करतात. अधिक जाणून घ्या
इलिनॉय, अर्बाना शॅम्पिन आणि कॅलिफोर्निया विद्यापीठातील संशोधकांची एक नवीन चौकट विकसकांना “भाषेच्या मॉडेल्सबद्दल विचार कसे करावे यावर) (एलएलएम) आणि सर्वात प्रभावी अनुमान बजेटचा फायदा घेत असताना त्यांची तार्किक क्षमता सुधारित करते यावर विकसकांना अधिक नियंत्रण देते.
अल्फाओन (α1) नावाची फ्रेम, चाचणीच्या वेळेची वेळ मोजण्याचे आणि महागड्या री -ट्रेडिंगची आवश्यकता न घेता तर्क दरम्यान मॉडेलचे वर्तन बदलण्याचे तंत्र आहे. हे प्रगत एलएलएमच्या विचारात सुधारित करण्याचा एक जागतिक मार्ग प्रदान करते, विकसकांना सध्याच्या पद्धतींपेक्षा अधिक नियंत्रित आणि प्रभावी मार्गाने जटिल कार्यात कार्यक्षमता सुधारण्यासाठी प्रदान करते.
हळू विचारांचे आव्हान
अलिकडच्या वर्षांत, ओपनई ओ 3 आणि दीपसीक-आर 1 सारख्या एलआरएमएस मॉडेल्समध्ये “सिस्टम 2” -स्लो, मानवी समजूतदारपणाच्या विचारवंत आणि तार्किक मोडद्वारे प्रेरित एकत्रित यंत्रणा आहेत. हे “सिस्टम 1” विचारांपेक्षा भिन्न आहे, जे वेगवान, अंतर्ज्ञानी आणि स्वयंचलित आहे. सिस्टम 2 च्या क्षमतांमध्ये विलीन केल्याने मॉडेल्सना गणित, कोडिंग आणि डेटा विश्लेषण यासारख्या क्षेत्रातील जटिल समस्या सोडविण्याची परवानगी मिळते.
हळू विचारसरणीसाठी “प्रतीक्षा”, “हम्म” किंवा “त्याऐवजी” यासारख्या ज्वलंत चिन्हे तयार करण्यासाठी मॉडेल्सना प्रशिक्षित केले जाते. जेव्हा यापैकी एक चिन्ह दिसून येते, तेव्हा मॉडेल त्याच्या मागील चरणांवर स्वत: ची प्रतिबिंब थांबवते आणि एखाद्या कठीण समस्येवर पुनर्विचार करणे थांबविणार्या व्यक्तीप्रमाणेच त्याचा मार्ग सुधारतो.
तथापि, विचार करणारे मॉडेल नेहमीच त्यांच्या विचारसरणीच्या क्षमतांचा वापर करत नाहीत. विविध अभ्यास असे सूचित करतात की ते “विचारांपेक्षा” किंवा गणना संसाधने किंवा “विचार” या किरकोळ समस्यांमुळे असुरक्षित आहेत, ज्यामुळे चुकीची उत्तरे मिळतात.
अल्फनच्या पेपरमध्ये असेही नमूद केले आहे की, “हे 1 ते 2 मर्यादित तार्किक विचारांच्या क्षमतेसारख्या व्यक्तीसारख्या इष्टतम संक्रमण क्षमता शोधण्यात एलआरएमएस असमर्थतेमुळे आहे, ज्यामुळे अप्रिय विचारांच्या कामगिरीला कारणीभूत ठरते.”
याकडे लक्ष देण्याचे दोन सामान्य मार्ग आहेत. समांतर स्केलिंग, जसे की “बेस्ट-एफएफ-एन” दृष्टिकोन अनेक वेळा चालतो आणि उत्कृष्ट उत्तर निवडतो, जे गणिताच्या बाबतीत महाग आहे. सीरियल स्केलिंग चालू असताना विचार प्रक्रिया समायोजित करण्याचा प्रयत्न करते. उदाहरणार्थ, एस 1 हे एक तंत्र आहे जे मॉडेलच्या संदर्भात “वेटिंग” कोड जोडून अधिक हळू विचारांना भाग पाडते, तर “सीओडी” पद्धत मॉडेलची मागणी कमी शब्दांचा वापर करून करते, ज्यामुळे त्याचे विचार बजेट कमी होते. तथापि, या पद्धती एक ठोस उपाय प्रदान करतात जे प्रत्येकाला बर्याचदा कुचकामी ठरतात.
विचारांची जागतिक चौकट
फक्त विचारांचे बजेट वाढविण्याऐवजी किंवा कमी करण्याऐवजी अल्फॉनमागील संशोधकांनी अधिक मूलभूत प्रश्न विचारला: जागतिक विचारांच्या अर्थसंकल्पात सुधारणा करू शकणार्या हळू आणि वेगवान विचारांमधील संक्रमणासाठी एक चांगले धोरण विकसित करणे शक्य आहे काय?
त्यांची फ्रेमवर्क, अल्फाओन, विकसकांना चाचणीच्या वेळी मॉडेलबद्दल विचार करण्याच्या प्रक्रियेचे अचूक नियंत्रण देते. सिस्टम अल्फा (α) मध्ये प्रवेश करून कार्य करते आणि मॉडेल विचारांचे बजेट वाढविण्यासाठी टॅब्लेट म्हणून कार्य करणारे हे एक शिक्षक आहे.
पिढीच्या एका विशिष्ट बिंदूच्या आधी, ज्यास संशोधकांनी “अल्फाचा क्षण” म्हटले आहे, धोरणात्मक अल्पॉन हळू आणि विचारशील विचारांना प्रोत्साहित करण्यासाठी विशिष्ट प्रतीक “प्रतीक्षा” ची वारंवारता निश्चित करते. हे पेपर “नियंत्रित आणि विकसित” म्हणून वर्णन करते.
एकदा आपण “क्षण α” वर पोहोचल्यानंतर, फ्रेमला परिस्थितीच्या संदर्भात एक प्रतीक घातले जाते, जे हळू विचार प्रक्रिया संपवते आणि मॉडेलला द्रुत विचारसरणीकडे स्विच करण्यास आणि त्याचे अंतिम उत्तर तयार करण्यास भाग पाडते.
मागील तंत्रज्ञान सामान्यत: संशोधकांना “निर्णायक बदल” म्हणतात, ज्यामुळे संपूर्ण ऑपरेशन दरम्यान एक किंवा दोनदा “प्रतीक्षा” चिन्ह जोडणे यासारख्या काही वेगळ्या समायोजनास कारणीभूत ठरते. उलटपक्षी, अल्फुनी बर्याचदा (जाड) किंवा क्वचितच (पूर्ण -वेळ) हस्तक्षेप करू शकते, ज्यामुळे विकसकांना इतर पद्धतींपेक्षा अधिक लोकप्रिय नियंत्रण मिळते.
“आम्ही अल्फाओनला जाणीवपूर्वक विचार करण्यासाठी एक युनिफाइड इंटरफेस, आवश्यक असलेल्या कल्पनांच्या मालिकेसाठी पूरक किंवा पसंती -आधारित संश्लेषण पाहतो आणि ठराविक संरचनेच्या बाजूने विकसित करण्यास सक्षम आहे.” “मुख्य फास्ट फूड अंमलबजावणीच्या तपशीलांशी संबंधित नाही, परंतु सामान्य तत्त्वाशी संबंधित आहे: क्षमता आणि कार्यक्षमता वाढविणार्या विचार प्रक्रियेमध्ये हळू संघटित दुरुस्ती.”
कामावर अल्फाऊन
संशोधकांनी अल्फनची चाचणी तीन वेगवेगळ्या विचारांच्या मॉडेल्सवर केली, 1.5 अब्ज ते 32 अब्ज पर्यंतच्या पॅरामीटर्सच्या आकारात. त्यांनी गणितातील सहा कठीण निकषांद्वारे तिच्या कामगिरीचे मूल्यांकन केले, कोड तयार केला आणि वैज्ञानिक समस्या सोडवल्या.
त्यांनी अल्फॅटॉनची तुलना तीन मूलभूत ओळींशी केली: नॉन -मॉडिफाइड व्हॅनिला मॉडेल; एस 1 पद्धत जी हळू विचारांची नीरसता वाढवते; मसुदा (सीओडी) ची साखळी कमी करण्याचा एक मार्ग आहे.
कृत्रिम बुद्धिमत्ता अनुप्रयोग तयार करणार्या विकसकांसाठी निकालांनी बरेच मोठे संबंधित मुख्य परिणाम तयार केले आहेत.
प्रथम, “धीमे विचारसरणी प्रथम, नंतर वेगवान विचार” या धोरणामुळे एलआरएमएसमध्ये अधिक चांगले विचारसरणी होते. हे एलएलएम आणि मानवी समज यांच्यातील मूलभूत अंतर हायलाइट करते, जे सहसा वेगवान विचारांच्या आधारे आयोजित केले जाते, त्यानंतर हळू विचारसरणी. मानवांच्या विपरीत, संशोधकांना असे आढळले की त्वरीत अभिनय करण्यापूर्वी मॉडेल्सला सक्तीने धीमे विचारसरणीचा फायदा होतो.
“हे सूचित करते की कृत्रिम बुद्धिमत्तेत प्रभावी विचारसरणी मानवी तज्ञांच्या अनुकरणातून बाहेर पडत नाही, परंतु फ्रँक विचारांच्या गतिशीलतेत बदल करून, जे त्वरित अभियांत्रिकी आणि तर्क सारख्या पद्धतींशी संबंधित आहे जे आधीपासूनच वास्तववादी अनुप्रयोगांमध्ये सादर केले गेले आहे.” “विकसकांसाठी, याचा अर्थ असा आहे की सिस्टम डिझाइनने कमीतकमी सध्याच्या काळात कार्यक्षमता आणि विश्वासार्हता सुधारण्यासाठी हळू विचारांचे वेळापत्रक सक्रियपणे लादले पाहिजे, तर सामान्य विचार अपूर्ण राहिले.”
आणखी एक मनोरंजक शोध असा आहे की मंद विचारात गुंतवणूक केल्याने सर्वसाधारणपणे अधिक कार्यक्षम निष्कर्ष येऊ शकतो. “हळू विचारसरणी विचारसरणी कमी होत असताना, एकूण चिन्हाची लांबी α1 सह लक्षणीय प्रमाणात कमी होते, ज्यामुळे हळू विचारांमुळे होणार्या विचारसरणीचा अधिक उपयुक्त फायदा होतो.” याचा अर्थ असा आहे की मॉडेलला “विचार करण्यास” अधिक वेळ लागतो, परंतु तो अधिक संक्षिप्त आणि अचूक विचार मार्ग तयार करतो, ज्यामुळे शेवटी तयार केलेल्या प्रतीकांची संख्या कमी होते आणि तर्कांची किंमत कमी होते.
एस 1 प्रमाणेच फाउंडेशन ओळींच्या तुलनेत, दोन अल्फल्स विशिष्ट चिन्हाचा सरासरी वापर अंदाजे 21 %कमी करतात, ज्यामुळे गणित आणि डॉक्टरांच्या समस्यांमधील विचारांच्या अचूकतेत 6.15 %वाढ होते.

“कोडची चौकशी करणे किंवा व्युत्पन्न करणे यासारख्या जटिल उत्तरासारख्या संस्थांसाठी, या नफ्यांचे दुहेरी फायद्याचे भाषांतर केले जाते: सुधारित पिढीची गुणवत्ता आणि मोठ्या किंमतीची बचत,” अल्फायियन म्हणाले. “मिशनच्या यशाचे दर आणि वापरकर्त्याचे समाधान सुधारताना यामुळे कमी अनुमान खर्च होऊ शकतो.”
अखेरीस, अभ्यासामध्ये असे आढळले आहे की उच्च वारंवारतेसह “प्रतीक्षा” प्रतीकांची ओळख उपयुक्त आहे, कारण मागील मार्गांपेक्षा विशिष्ट चिन्हाची नोंद करून चांगले परिणाम मिळवले.
विकसकांना नवीन स्तरावर नियंत्रण दिल्यास अल्फाओन, ज्याचे प्रतीक लवकरच सोडले जाईल अशी अपेक्षा आहे, त्यांना पुढील पिढीच्या विचारांच्या मॉडेल्सपेक्षा अधिक स्थिर, विश्वासार्ह आणि प्रभावी अनुप्रयोग तयार करण्यास मदत करू शकते.
“ओपन सोर्स मॉडेल्स वापरणार्या किंवा खास डिझाइन केलेल्या कंपन्यांसाठी, विशेषत: शिकवण्याच्या पूर्व टप्प्यात ज्वलंत प्रतीकांमध्ये प्रशिक्षित असलेल्या अल्फाओनची रचना समाकलित करणे सोपे आहे,” व्हेंचरबीटमधील अल्फून म्हणाले. “सराव मध्ये, एकत्रीकरणास सहसा कमीतकमी बदलांची आवश्यकता असते, जसे की केवळ निर्मिती सॉफ्टवेअरमध्ये मॉडेलचे नाव अद्यतनित करणे.”
Source link