ओपीनीने नवीन संशोधन प्रकाशित केले आहे, असे स्पष्ट केले आहे की चॅटझप्ट, त्याचे सर्वात सामान्यपणे वापरले जाणारे भाषा मॉडेल, कधीकधी खोटे आहे, परंतु चीर माहिती तयार करते – एक कार्यक्रम “भ्रम” म्हणून ओळखला जातो.
एजन्सीच्या मते, मुख्य कारणे या मॉडेल्सचे प्रशिक्षण आणि मूल्यांकन करण्याच्या मार्गात आहेत, अनिश्चिततेचा अंदाज लावणार्या प्रक्रिये.
न्यूजवीक सामान्य कामाच्या वेळेच्या पलीकडे अधिक माहितीसाठी ओपनएआयशी संपर्क साधा.
ते का महत्वाचे आहे
CHATGPT सारख्या मोठ्या -भाषेतील मॉडेल्स वाढत्या शिक्षण, आरोग्यसेवा, ग्राहक सेवा आणि अचूकता महत्त्वपूर्ण असलेल्या इतर प्रकरणांमध्ये वाढत्या प्रमाणात वाढत आहेत. खरोखर चुकीचे परंतु वैधता उपस्थित असू शकते हे भ्रमकलेचे आउटपुट-स्टेटमेंट्स विश्वास कमी करतात आणि वास्तविक-जगातील हानी पोहोचवतात.
काय माहित आहे
जीपीटी -5 सह अधिक सक्षम मॉडेल्सच्या विकासाची प्रगती असूनही, भ्रम सतत समस्या म्हणून राहते, विशेषत: जेव्हा मॉडेलना विशिष्ट माहितीचा डेटा तयार करण्याची विनंती केली जाते.
या समस्येचे निराकरण करण्यासाठी ओपनई वैज्ञानिकांना या समस्येचे निराकरण करण्यासाठी स्ट्रक्चरल बदलांची आवश्यकता होती.
ओपनईच्या अंतर्गत व्याख्येनुसार, भ्रम “भाषेच्या मॉडेलद्वारे व्युत्पन्न केलेले कौतुकास्पद परंतु खोटे विधान” आहे.
अभ्यासामध्ये उद्धृत केलेले एक उदाहरण असे आहे की संशोधन संशोधन संशोधनात चॅटबॉटसाठी अनेक शीर्षके समाविष्ट आहेत, त्या सर्व चुकीचे आहेत. इतर प्रकरणांमध्ये, मॉडेलने त्याच व्यक्तीच्या वाढदिवसासाठी तीन स्वतंत्र, समान रीतीने चुकीची तारीख दिली.
गेटी प्रतिमा
भाषेचे मॉडेल कसे प्रशिक्षित केले जातात या कारणास्तव हे आहे. गर्भधारणा दरम्यान, मॉडेल्सने बर्याच ग्रंथांच्या आधारे वाक्यात पुढील शब्दाचा अंदाज लावणे शिकले आहे, परंतु कोणते विधान चुकीचे आहे हे कधीही दर्शविले जात नाही. या आकडेवारीची प्रक्रिया, तथापि, सुसंगत भाषा तयार करण्यात, जन्मतारीख आणि प्रकाशित शीर्षक यासारख्या अल्प-मुक्त माहितीशी लढण्यासाठी प्रभावी आहे.
जेव्हा या राष्ट्रीय मॉडेल्सची कामगिरीसाठी चाचणी केली जाते, तेव्हा अचूकता बहुतेक वेळा एकमेव मेट्रिक मानली जाते. हे एकाधिक-निवड चाचण्यांचे समान प्रोत्साहन तयार करते: “मला माहित नाही” असे म्हणण्यापेक्षा अंदाज करणे सांख्यिकीय दृष्टीने चांगले आहे. संशोधकांच्या म्हणण्यानुसार, “जर मुख्य स्कोअरबोर्डने भाग्यवान अंदाजांना बक्षीस दिले तर मॉडेल्सचा अंदाज घेणे शिकले जाईल.”
समस्येचे वर्णन करण्यासाठी, कार्यसंघाने मूलभूत मूल्यांकन चाचणीत दोन मॉडेल्सची तुलना केली. नवीन जीपीटी -5 रूपांमध्ये थकलेल्या दराच्या 52 टक्के आणि 26 टक्के त्रुटी दर होता. दरम्यान, ओपनई आणि 4 मिनिटांच्या जुन्या मॉडेलने 1 टक्के दुर्लक्ष दर्शविले परंतु 75 टक्के त्रुटी दर्शविली.
लोक काय म्हणत आहेत
ओपि यांनी लिहिले संशोधन संशोधनात: “ओपनईमध्ये आम्ही एआय सिस्टमला अधिक उपयुक्त आणि विश्वासार्ह बनविण्यासाठी कठोर परिश्रम करीत आहोत. भाषेचे मॉडेल्स एक आव्हान पूर्णपणे जिद्दीने सोडविण्यास अधिक सक्षम बनतात: भ्रम. याचा अर्थ असा आहे की आम्ही ही उदाहरणे आहोत जिथे आत्मविश्वासाचे मॉडेल असे उत्तर देते जे खरे नाही.
“भ्रम अंशतः सुरू ठेवतात कारण सध्याच्या मूल्यांकन पद्धती चुकीच्या प्रोत्साहन देतात. मूल्यमापन थेट भ्रम निर्माण करत नसले तरी बहुतेक मूल्यमापन मॉडेलच्या कामगिरीला अशा प्रकारे मोजते जे प्रामाणिकपणाऐवजी अनिश्चिततेचा अंदाज लावण्यास प्रोत्साहित करते.”
त्यानंतर
ओपन म्हणतात की ते निराश करण्याऐवजी मूल्यांकन निकष अनिश्चिततेच्या पुरस्कारासाठी नूतनीकरण करण्याचे काम करीत आहेत.