ओपीनीने नवीन संशोधन प्रकाशित केले आहे, असे स्पष्ट केले आहे की चॅटझप्ट, त्याचे सर्वात सामान्यपणे वापरले जाणारे भाषा मॉडेल, कधीकधी खोटे आहे, परंतु चीर माहिती तयार करते – एक कार्यक्रम “भ्रम” म्हणून ओळखला जातो.

एजन्सीच्या मते, मुख्य कारणे या मॉडेल्सचे प्रशिक्षण आणि मूल्यांकन करण्याच्या मार्गात आहेत, अनिश्चिततेचा अंदाज लावणार्‍या प्रक्रिये.

न्यूजवीक सामान्य कामाच्या वेळेच्या पलीकडे अधिक माहितीसाठी ओपनएआयशी संपर्क साधा.

ते का महत्वाचे आहे

CHATGPT सारख्या मोठ्या -भाषेतील मॉडेल्स वाढत्या शिक्षण, आरोग्यसेवा, ग्राहक सेवा आणि अचूकता महत्त्वपूर्ण असलेल्या इतर प्रकरणांमध्ये वाढत्या प्रमाणात वाढत आहेत. खरोखर चुकीचे परंतु वैधता उपस्थित असू शकते हे भ्रमकलेचे आउटपुट-स्टेटमेंट्स विश्वास कमी करतात आणि वास्तविक-जगातील हानी पोहोचवतात.

काय माहित आहे

जीपीटी -5 सह अधिक सक्षम मॉडेल्सच्या विकासाची प्रगती असूनही, भ्रम सतत समस्या म्हणून राहते, विशेषत: जेव्हा मॉडेलना विशिष्ट माहितीचा डेटा तयार करण्याची विनंती केली जाते.

या समस्येचे निराकरण करण्यासाठी ओपनई वैज्ञानिकांना या समस्येचे निराकरण करण्यासाठी स्ट्रक्चरल बदलांची आवश्यकता होती.

ओपनईच्या अंतर्गत व्याख्येनुसार, भ्रम “भाषेच्या मॉडेलद्वारे व्युत्पन्न केलेले कौतुकास्पद परंतु खोटे विधान” आहे.

अभ्यासामध्ये उद्धृत केलेले एक उदाहरण असे आहे की संशोधन संशोधन संशोधनात चॅटबॉटसाठी अनेक शीर्षके समाविष्ट आहेत, त्या सर्व चुकीचे आहेत. इतर प्रकरणांमध्ये, मॉडेलने त्याच व्यक्तीच्या वाढदिवसासाठी तीन स्वतंत्र, समान रीतीने चुकीची तारीख दिली.

स्टॉक प्रतिमा: 1 सप्टेंबर रोजी घेतलेल्या एका फोटोमध्ये जर्मनीच्या फ्रँकफर्टमधील स्मार्टफोन स्क्रीन, लॅपटॉप स्क्रीनवरील चॅटझप्ट अनुप्रयोग लोगो, चॅटझप्ट लोगोवर दर्शविला गेला आहे.

गेटी प्रतिमा

भाषेचे मॉडेल कसे प्रशिक्षित केले जातात या कारणास्तव हे आहे. गर्भधारणा दरम्यान, मॉडेल्सने बर्‍याच ग्रंथांच्या आधारे वाक्यात पुढील शब्दाचा अंदाज लावणे शिकले आहे, परंतु कोणते विधान चुकीचे आहे हे कधीही दर्शविले जात नाही. या आकडेवारीची प्रक्रिया, तथापि, सुसंगत भाषा तयार करण्यात, जन्मतारीख आणि प्रकाशित शीर्षक यासारख्या अल्प-मुक्त माहितीशी लढण्यासाठी प्रभावी आहे.

जेव्हा या राष्ट्रीय मॉडेल्सची कामगिरीसाठी चाचणी केली जाते, तेव्हा अचूकता बहुतेक वेळा एकमेव मेट्रिक मानली जाते. हे एकाधिक-निवड चाचण्यांचे समान प्रोत्साहन तयार करते: “मला माहित नाही” असे म्हणण्यापेक्षा अंदाज करणे सांख्यिकीय दृष्टीने चांगले आहे. संशोधकांच्या म्हणण्यानुसार, “जर मुख्य स्कोअरबोर्डने भाग्यवान अंदाजांना बक्षीस दिले तर मॉडेल्सचा अंदाज घेणे शिकले जाईल.”

समस्येचे वर्णन करण्यासाठी, कार्यसंघाने मूलभूत मूल्यांकन चाचणीत दोन मॉडेल्सची तुलना केली. नवीन जीपीटी -5 रूपांमध्ये थकलेल्या दराच्या 52 टक्के आणि 26 टक्के त्रुटी दर होता. दरम्यान, ओपनई आणि 4 मिनिटांच्या जुन्या मॉडेलने 1 टक्के दुर्लक्ष दर्शविले परंतु 75 टक्के त्रुटी दर्शविली.

लोक काय म्हणत आहेत

ओपि यांनी लिहिले संशोधन संशोधनात: “ओपनईमध्ये आम्ही एआय सिस्टमला अधिक उपयुक्त आणि विश्वासार्ह बनविण्यासाठी कठोर परिश्रम करीत आहोत. भाषेचे मॉडेल्स एक आव्हान पूर्णपणे जिद्दीने सोडविण्यास अधिक सक्षम बनतात: भ्रम. याचा अर्थ असा आहे की आम्ही ही उदाहरणे आहोत जिथे आत्मविश्वासाचे मॉडेल असे उत्तर देते जे खरे नाही.

“भ्रम अंशतः सुरू ठेवतात कारण सध्याच्या मूल्यांकन पद्धती चुकीच्या प्रोत्साहन देतात. मूल्यमापन थेट भ्रम निर्माण करत नसले तरी बहुतेक मूल्यमापन मॉडेलच्या कामगिरीला अशा प्रकारे मोजते जे प्रामाणिकपणाऐवजी अनिश्चिततेचा अंदाज लावण्यास प्रोत्साहित करते.”

त्यानंतर

ओपन म्हणतात की ते निराश करण्याऐवजी मूल्यांकन निकष अनिश्चिततेच्या पुरस्कारासाठी नूतनीकरण करण्याचे काम करीत आहेत.

स्त्रोत दुवा