उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
एलएलएमएस मॉडेल्सने विचार करण्याच्या क्षमतेच्या वापरामध्ये उल्लेखनीय प्रगती केली आहे. तथापि, बाह्य डेटाचा संदर्भ घेण्याची आणि योग्यरित्या वापरण्याची त्यांची क्षमता – ज्या माहितीवर प्रशिक्षण दिले गेले नाही – विचारांच्या संयोगाने मोठ्या प्रमाणात विलंब झाला आहे.
डायनॅमिक डायनॅमिक परिदृश्यांचा वापर करताना ही एक विशेष समस्या आहे, तीव्र माहिती ज्यास शोध इंजिनमधून अद्यतनित डेटा आवश्यक आहे.
परंतु ही सुधारणा आली आहे: अर्बाना-कॅम्पेन येथील इलिनॉय विद्यापीठ आणि मॅसेच्युसेट्स अमर्स्ट विद्यापीठातील संशोधकांनी सादर केलेले एक तंत्र शोध-आर 1, शोध चौकशी व्युत्पन्न करण्यासाठी आणि शोध इंजिनला त्यांच्या कारणांमध्ये सहजतेने समाकलित करण्यासाठी एलएलएमला प्रशिक्षण देते.
या नवीन मॉडेल्सना त्यांच्या अनुप्रयोगांमध्ये समाकलित करण्याचे मार्ग शोधून, शोध-आर 1 सारख्या तंत्रज्ञानाने बाह्य डेटा स्रोतांवर अवलंबून असलेल्या नवीन विचारांची क्षमता रद्द करणे आहे.
एलएलएमसह संशोधन एकत्र करण्याचे आव्हान
अद्ययावत बाह्य ज्ञानासह एलएलएम अनुप्रयोग प्रदान करण्यासाठी शोध इंजिन निर्णायक आहेत. एलएलएमएससह शोध इंजिन एकत्र करण्यासाठी दोन मुख्य पद्धती म्हणजे रॅग जनरेशन (आरएजी) आणि साधनांचा वापर, जे द्रुत अभियांत्रिकी किंवा परिष्कृत मॉडेलद्वारे लागू केले जातात.
तथापि, दोन्ही पद्धतींमध्ये असे निर्बंध आहेत जे त्या विचारांच्या मॉडेलसाठी योग्य नाहीत. आरएजी बर्याचदा पुनर्प्राप्तीच्या चुकीने संघर्ष करते आणि मल्टी -टर्न करण्याची क्षमता नसते, जे विचारांच्या कार्यांसाठी आवश्यक आहे.
टूल -आधारित साधनाचा वापर बर्याचदा सामान्यीकरणासह संघर्ष केला जातो, तर प्रशिक्षण -आधारित पद्धतींमध्ये संशोधन आणि हंगामी प्रतिक्रियांचे मोठ्या प्रमाणात डेटा गट आवश्यक असतात, जे मोठ्या प्रमाणात उत्पादन करणे कठीण आहे.
(विचारांच्या मॉडेल्ससह आमच्या स्वतःच्या अनुभवांमध्ये, आम्हाला आढळले की माहिती पुनर्प्राप्ती अद्याप मुख्य आव्हानांपैकी एक आहे.)
आर 1 शोधा
शोध-आर 1 एलएलएम शोध इंजिनसह परस्परसंवाद सक्षम करते दरम्यान वेगळ्या पुनर्प्राप्ती अवस्थेऐवजी त्यांची विचारसरणी प्रक्रिया.
शोध-आर 1 शोध इंजिनला एलएलएम वातावरणाचा एक भाग म्हणून परिभाषित करते, ज्यामुळे मॉडेलला शोध इंजिनच्या परिणामासह विशिष्ट प्रतीकाची निर्मिती सहजतेने समाकलित करण्याची परवानगी मिळते.
विचार आणि पुनरावृत्ती संशोधनास समर्थन देण्यासाठी डिझाइन केलेले शोध-आर 1 संशोधक. मॉडेलला विचार, संशोधन, माहिती आणि उत्तरांसाठी चिन्हांचे स्वतंत्र गट तयार करण्याचे प्रशिक्षण दिले गेले आहे. याचा अर्थ असा की विचार प्रक्रियेदरम्यान (हे वैशिष्ट्यीकृत आहे
ही रचना मॉडेलला शोध इंजिनला बर्याच वेळा बोलावण्यास अनुमती देते कारण ती समस्येची कारणे आहे आणि नवीन माहिती मिळवते (खाली उदाहरण पहा).
शिकण्याची मजबुतीकरण
त्यांच्या विचारसरणीच्या साखळीसह शोध चौकशीचे इंटरलीव्ह्सचे एलएलएमएस प्रशिक्षण एक आव्हान आहे. प्रक्रिया सुलभ करण्यासाठी, शोध-आर 1 संशोधकांनी शुद्ध मजबुतीकरण शिक्षण (आरएल) च्या माध्यमातून मॉडेलला प्रशिक्षण देण्यासाठी डिझाइन केलेले, जेथे मॉडेलने मान्याने तयार केलेल्या डेटाचे निर्देश न देता विचार आणि संशोधन साधनांचा वापर शोधण्यासाठी सोडले आहे.
शोध-आर 1 “परिणामांवर आधारित बोनस फॉर्म” वापरते, जेथे मॉडेलचे मूल्यांकन केवळ अंतिम प्रतिसादाच्या वैधतेच्या आधारे केले जाते. हे मॉडेलची विचारसरणी तपासणारी जटिल बक्षीस मॉडेल तयार करण्याची आवश्यकता दूर करते.
दीपसीक-आर 1-झेरोमध्ये हा समान दृष्टिकोन आहे, जेथे मॉडेलला एक महत्त्वपूर्ण आणि केवळ निकालाच्या आधारे शिक्षा सुनावण्यात आली. आरएल शुद्ध आरएल वापरणे व्यक्तिचलितपणे स्पष्ट केलेल्या उदाहरणे (सुपरवायझरी कंट्रोल) वरून मोठे डेटा संग्रह तयार करण्याची आवश्यकता टाळते.
“शोध-आर 1 हा दीपसीक-आर 1 चा विस्तार मानला जाऊ शकतो, जो आरएल प्रशिक्षण देऊन मुख्यतः पॅरामीट्री विचारांवर लक्ष केंद्रित करतो जो पुनर्प्राप्ती निर्णय घेण्याच्या प्रक्रियेच्या शोधात हलविला गेला आहे,” संशोधक त्यांच्या पेपरमध्ये लिहितात.
कामावर आर 1 शोधा
संशोधकांनी क्यूएन -2.5 आणि लामा -3.2 च्या बेस तयार करुन आणि दिग्दर्शित आवृत्त्याद्वारे शोध-आर 1 ची चाचणी केली आणि सात निकषांचे मूल्यांकन केले ज्यामध्ये एकल संशोधन आणि बहु-जंप आवश्यक असलेल्या विविध विचारांची कार्ये समाविष्ट आहेत. त्यांनी शोध-आर 1 ची तुलना वेगवेगळ्या मूलभूत ओळीशी केली: vet विचारात थेट अनुमान (सीओटी), कटिंगचा अनुमान आणि साधनांच्या वापराच्या देखरेखीच्या अधीन नियंत्रण.
आर 1 शोध योग्य मार्जिनसह फाउंडेशन लाइन पद्धतींमध्ये सतत कामगिरी करत असतो. हे आरएलवर प्रशिक्षण घेतलेल्या विचारांच्या मॉडेल्सनाही मागे टाकते, परंतु संशोधन परत न करता. “हे अपेक्षांशी संबंधित आहे, जसे की एलएलएममध्ये विचारात संशोधन समाकलित करणे संबंधित बाह्य ज्ञानामध्ये प्रवेश प्रदान करते आणि सामान्य कामगिरी सुधारते,” संशोधक लिहितात.

शोध-आर 1 भिन्न मॉडेल्स, बेस व्हेरिएबल्स आणि चालू असलेल्या सूचनांच्या कुटुंबांसाठी देखील प्रभावी आहे, हे दर्शविते की परिणाम-आधारित बक्षिसे असलेले आरएल शुद्ध विचारांच्या परिस्थितीपेक्षा अधिक उपयुक्त ठरू शकते. संशोधकांनी गीथबवर शोध-आर 1 सोडला.
शोध चौकशीसाठी शोध संस्था स्वतंत्रपणे संस्थांच्या अनुप्रयोगांवर उत्कृष्ट परिणाम विचारात वास्तविक वेळेत माहिती समाकलित करू शकतात आणि समाकलित करू शकतात. हे ग्राहक समर्थन, ज्ञान व्यवस्थापन आणि डेटा विश्लेषण यासारख्या क्षेत्रांमध्ये एलएलएम सिस्टमची अचूकता आणि विश्वासार्हता वाढवू शकते. बदलत्या माहितीशी गतिशीलपणे रुपांतर करण्यासाठी एलएलएमएस सक्षम करून, शोध-आर 1 संस्थांना अधिक बुद्धिमान आणि वेगवान कृत्रिम बुद्धिमत्ता समाधान तयार करण्यात मदत करू शकते. ही शक्यता अनुप्रयोगांसाठी खूप उपयुक्त ठरू शकते ज्यांना सतत बदलणार्या डेटामध्ये प्रवेश आवश्यक आहे, ज्यास उत्तर शोधण्यासाठी एकाधिक चरणांची आवश्यकता असते.
हे देखील सूचित करते की डीपसीक-आर 1 लाँच झाल्यापासून आम्हाला नवीन मजबुतीकरण शिक्षण मॉडेलची पूर्ण क्षमता अद्याप शोधावी लागेल.
Source link
















