उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


मेटास्केल नावाची एक नवीन फ्रेम तर्किंगच्या वेळी विचारसरणीला अनुकूल करण्यासाठी मोठ्या भाषेचे मॉडेल (एलएलएमएस) सक्षम करते. या फ्रेमचा उपचार एलएलएमएसमधील एका उणीवाद्वारे केला जातो, जो सर्व प्रकारच्या समस्यांसाठी समान विचारांची रणनीती वापरतो.

कॅलिफोर्निया विद्यापीठ, डेव्हिस, युनिव्हर्सिटी ऑफ सदर्न कॅलिफोर्निया आणि मायक्रोसॉफ्ट रिसर्च, मेटास्केल या संशोधकांनी हे एका पेपरमध्ये सादर केले होते, जे प्रत्येक कार्य करण्यासाठी डिझाइन केलेले “उच्च-मनाचे”-मॉडिफाइड विचारांची रणनीती वापरते आणि विविध कार्यांमध्ये सामान्यीकरण सुधारते.

हा दृष्टिकोन मॉडेल्स बदलल्याशिवाय किंवा महागड्या पॉलिशिंग प्रयत्नांमध्ये गुंतल्याशिवाय त्यांच्या एलएलएम अनुप्रयोगांची अचूकता आणि कार्यक्षमता वाढविण्यासाठी संस्था प्रदान करू शकते.

निश्चित विचार करण्याच्या धोरणांवर निर्बंध

एलएलएम अनुप्रयोगांचे एक मुख्य आव्हान निश्चित आणि बेकायदेशीर विचारांचे वर्तन आहे. मानवांच्या विपरीत, जे समस्यांचे निराकरण करण्यासाठी वेगवेगळे मार्ग निवडू शकतात, एलएलएम बहुतेकदा त्यांच्या प्रशिक्षण डेटामधील जुळणार्‍या नमुन्यांवर अवलंबून असतात, जे मानवांनी वापरलेल्या विचारांच्या योग्य तत्त्वांशी नेहमीच अनुरुप नसतात.

विचारांच्या प्रक्रियेवर नियंत्रण ठेवण्याचे सध्याचे मार्ग बर्‍याचदा डिझाइन केले जातात, जसे की आयडिया मालिका (सीओटी), स्वत: ची विचारसरणी आणि उलट विचार, विशिष्ट कार्यांसाठी, जे विविध परिस्थितीद्वारे परिस्थितीशी जुळवून घेण्याची क्षमता आणि त्याची प्रभावीता मर्यादित करते.

संशोधकांनी नमूद केले आहे की “या पद्धती एलएलएमला कार्याची सर्वात प्रभावी रणनीती परिभाषित करण्यास सक्षम करण्याऐवजी सतत विचारसरणी लावतात, ज्यामुळे त्यांची कार्यक्षमता मर्यादित होते.”

या निर्बंधाला संबोधित करण्यासाठी, संशोधक “रूपकात्मक विचार” ही संकल्पना सुचवतात. ही एलएलएमएस प्रक्रिया प्रतिसाद तयार करण्यापूर्वी त्याच्या दृष्टिकोनाबद्दल विचार करण्यास अनुमती देते. मेटल पॅनेल मानवी समजुतीद्वारे प्रेरित दोन घटकांद्वारे विचार करण्याच्या प्रक्रियेद्वारे निर्देशित केले जातात:

संज्ञानात्मक मानसिकता: कार्य सामोरे जाण्यासाठी मॉडेलद्वारे स्वीकारलेली दृष्टीकोन, अनुभव किंवा भूमिका.

समस्या सोडवण्याची रणनीती: निवडलेल्या मानसिकतेवर आधारित टास्क सोल्यूशन तयार करण्यासाठी वापरलेला एक संघटित नमुना.

समस्येचे निराकरण करण्याऐवजी, एलएलएम प्रथम विचार कसे करावे हे परिभाषित करते, सर्वात योग्य संज्ञानात्मक धोरण निवडा. उदाहरणार्थ, जेव्हा आपल्याला एखाद्या जटिल सॉफ्टवेअर समस्येचा सामना करावा लागतो, तेव्हा एलएलएम प्रथम ते सोडवणार्‍या व्यावसायिकांच्या प्रकाराबद्दल विचार करू शकेल (उदाहरणार्थ, सॉफ्टवेअर अभियंता) आणि समस्येस सामोरे जाण्यासाठी एक धोरण निवडू शकेल (उदाहरणार्थ, समस्या खंडित करण्यासाठी डिझाइनचे नमुने वापरणे किंवा प्रकाशन सुलभ करण्यासाठी लहान सेवा दृष्टिकोन वापरणे).

“या चरणात उत्कृष्ट विचारसरणी विलीन करून, एलएलएम कठोर आणि पूर्व -निर्धारित तर्कांवर अवलंबून राहण्याऐवजी विविध कार्यांसह विचारसरणी प्रक्रिया गतिकरित्या अनुकूल करू शकतात,” संशोधक लिहितात.

धातूच्या काठ्यांवर अवलंबून, संशोधक मेटास्केल सादर करतात, एक चाचणी टाइम फ्रेम जी त्वरित अभियांत्रिकीद्वारे कोणत्याही मॉडेलवर लागू केली जाऊ शकते.

“एलएलएमला वेगवेगळ्या विचारांची रणनीती एक्सप्लोर करणे आणि काही विशिष्ट इनपुटला सर्वात प्रभावी प्रतिसाद मिळविणे हे ध्येय आहे.”

मेटास्केल तीन टप्प्यात कार्य करते:

तयारी: मेटास्केल इनपुट वेव्हवर आधारित विविध विचारांची रणनीती व्युत्पन्न करते. हे एलएलएमला सेल्फ -अ‍ॅडॉप्टिव्ह रणनीतींकडे उद्युक्त करून करते आणि विविध प्रकारच्या समस्यांसाठी विचारांच्या मोल्ड्स असलेल्या इंस्ट्रक्शन कंट्रोल डेटा सेट्सचा फायदा करून हे करते. हे मिश्रण धातूचा एक समृद्ध प्राथमिक गट तयार करते.

निवडण्यासाठी: मल्टी -वेपन्स अल्गोरिदम (एमएबी) प्रत्येक पुनरावृत्तीसाठी सर्वात आशादायक सुपरस्ट्रक्चर निवडते. एमएबी ही एक समस्या फ्रेम आहे जिथे कामगारांनी एकाधिक पर्याय किंवा “शस्त्रे” दरम्यान पुन्हा पुन्हा निवडले पाहिजे, प्रत्येक अज्ञात बक्षीस वितरणासह. मुख्य आव्हान म्हणजे “अन्वेषण” (उदाहरणार्थ, भिन्न विचारांची रणनीती वापरण्याचा प्रयत्न करणे) आणि “शोषण” (यापूर्वी सर्वोत्कृष्ट प्रतिसाद सादर करणारे विचार धोरण निवडणे). मेटास्केलमध्ये, रूपकाच्या सर्व सदस्यांना हात म्हणून मानले जाते आणि विशिष्ट सुपरस्ट्रक्चरच्या आधारे बक्षीस (प्रतिसाद गुणवत्ता) जास्तीत जास्त करणे हे ध्येय आहे.

विकास: अनुवांशिक अल्गोरिदम सुधारित करते आणि संज्ञानात्मक रणनीतींचा संच वारंवार वाढवते. मेटास्केल नवीन “मूल” फिल्टरिंग साधने तयार करण्यासाठी “पालक” म्हणून उच्च -कार्यक्षमता ग्राफिक साधने वापरते. एलएलएमला निवडलेल्या पालकांसाठी साधने विकसित करणे आणि सुधारणे आवश्यक आहे. प्रभावी राहण्यासाठी, ग्राफिक साधने तयार करताना मेटास्केल निश्चित नमुन्यांच्या बजेटमध्ये कार्य करते.

संशोधकांनी स्पोर्ट्स थिंकिंग (जीएसएम 8 के), ज्ञान आणि भाषा समजून घेणे (एमएमएलयू-प्रो), रिंगण-हार्ड या मानकांवर मेटास्केलचे मूल्यांकन केले, त्यांची तुलना चार मूलभूत अनुमान पद्धतींशी केली: थेट प्रतिसाद (एकल तर्क), सर्वोत्कृष्ट कॉट, सर्वोत्कृष्ट एकापेक्षा जास्त प्रतिसाद आणि सर्वोत्तम मार्गाची निवड) आणि सीओटी सह. त्यांनी त्यांच्या अनुभवांचा कणा म्हणून जीपीटी -4 ओ आणि लामा -3.1-8 बी-इन्स्ट्रक्टचा वापर केला.

परिणामांनी हे सिद्ध केले की मेटास्केल एलएलएम समस्येस मोठ्या प्रमाणात वाढवते -विविध कार्यांद्वारे विकृती क्षमता वाढवते, सतत पाया रेखा पद्धतींना मागे टाकते. मेटास्केलने सर्व मूलभूत रेषांच्या तुलनेत समान किंवा उत्कृष्ट कामगिरी साध्य केली आहे, ते सीओटी प्रॉम्प्टिंगद्वारे वापरले जातात की नाही याची पर्वा न करता. हे लक्षात घेण्यासारखे आहे की जीपीटी -4 ओ शैलीच्या नियंत्रणाखाली मेटास्केलने ओ 1-मिनी आउटफॉर्म केले.

संशोधकांचे म्हणणे आहे: “हे परिणाम दर्शविते की चित्रपटांचे विलीनीकरण केल्यामुळे नमुन्यांची संख्या वाढवून चाचणीच्या वेळी एलएलएमएस अधिक प्रभावीपणे वाढविण्यास सक्षम करते,” संशोधकांचे म्हणणे आहे.

उमेदवारांच्या समाधानाची संख्या जसजशी वाढत गेली तसतसे मेटास्केलने इतर मूलभूत ओळींपेक्षा जास्त नफा दर्शविला आहे, हे दर्शविते की ते अधिक प्रभावी धोरण आहे.

संस्थेचा परिणाम

चाचणी वेळ तंत्रज्ञान म्हणून, मेटास्केल मॉडेल समायोजित किंवा पुनर्स्थित न करता स्मार्ट डिमांड इंजिनिअरिंगद्वारे एलएलएममध्ये विचारांची गुणवत्ता सुधारण्यास संस्थांना मदत करू शकते. मॉडेलच्या वरील जटिल सॉफ्टवेअर स्क्रिप्ट्सच्या बांधकामाची देखील आवश्यकता नाही, कारण एलएलएम स्वतःच तर्कशास्त्र पूर्णपणे प्रदान केले आहे.

एलएलएमएसमध्ये विचारांची रणनीती निश्चित करून, मेटास्केल हे वास्तववादी अनुप्रयोगांसाठी देखील व्यावहारिक आहे जे वेगवेगळ्या विचारांच्या कार्यांसह व्यवहार करतात. ही एक काळी पद्धत देखील आहे, जी ओपन सोर्स मॉडेल्सवर लागू केली जाऊ शकते जी संस्थेच्या ढगांवर कार्य करते किंवा तृतीय -पक्षाच्या अनुप्रयोग प्रोग्रामिंगच्या दर्शनी भागाच्या मागे कार्य करणार्‍या बंद मॉडेल्सवर कार्य करते. हे चाचणी कार्येच्या वेळी स्केलिंग तंत्राची आशादायक क्षमता दर्शविते.


Source link