चॅटजीपीटी चॅटबॉटच्या नुकत्याच झालेल्या अद्यतनांनी शुक्रवारी ओपनईए केले की ही समस्या पुन्हा होण्यापासून रोखण्यासाठी पावले उचलली.
ब्लॉग पोस्टमध्ये, कंपनीने नवीन मॉडेल्ससाठी त्याच्या चाचणी आणि मूल्यांकन प्रक्रियेचा तपशीलवार माहिती दिली आणि जीपीटी -4 ओ मॉडेलचे 25 एप्रिल रोजी समस्या कशी बनली हे स्पष्ट करते. मूलभूतपणे, एक साधन तयार करण्यासाठी वैयक्तिकरित्या उपयुक्त दिसणार्या बदलांचा एक संच अत्यंत आणि कदाचित हानिकारक होता.
किती शोषण होते? या आठवड्याच्या सुरूवातीच्या काही चाचण्यांमध्ये आम्ही खूप भावनिक होण्याच्या प्रवृत्तीबद्दल विचारले, आणि चापट वर ठेवले: “अहो, जे भावनिक आहे ते ऐका कमकुवत नाही; हे एक आहे महासत्ता?
कंपनीने म्हटले आहे: “आम्ही या प्रक्षेपणाचे अनेक धडे शिकवले,” असे कंपनीने सांगितले.
या आठवड्यात ओपनई अद्यतनावर पडला. नवीन समस्या उद्भवू नये म्हणून प्रत्येकासाठी मॉडेल पुनर्संचयित करण्यास सुमारे 24 तास लागले.
सायकोफन्सबद्दल लक्ष केवळ वापरकर्त्याच्या अनुभवाच्या पातळीबद्दलच नाही. ओपनईमध्ये सध्याची सुरक्षा तपासणी गमावलेल्या वापरकर्त्यांसाठी आरोग्य आणि सुरक्षिततेसाठी हा धोका आहे. कोणतेही n म्नेस्टी इंटरनॅशनल मॉडेल मानसिक आरोग्यासारख्या विषयांवर शंकास्पद सल्ला देऊ शकते, परंतु पुढे ढकलणे किंवा गंभीरपणे खात्री पटविणे जास्त असू शकते – जसे की ही गुंतवणूक निश्चित आहे की नाही हे कसे आहे.
ओब्रे म्हणाले, “सर्वात मोठ्या धड्यांपैकी एक म्हणजे खोल वैयक्तिक सल्ल्यासाठी लोक चॅटजीपीटी कसे वापरण्यास सुरवात करतात – एक वर्षापूर्वी आपण पाहिले नाही,” ओब्रे म्हणाले. “त्यावेळी ही एक अत्यावश्यक अक्ष नव्हती, परंतु कृत्रिम बुद्धिमत्ता आणि समाजाच्या विकासामुळे हे स्पष्ट झाले की आम्हाला या वापराच्या अवस्थेशी अत्यंत काळजीपूर्वक सामोरे जाणे आवश्यक आहे.”
कार्नेगी मेलॉन युनिव्हर्सिटीच्या संगणक विज्ञानाचे सहाय्यक प्राध्यापक मार्टिन सबब म्हणाले की, मोठ्या एक्स -भाषेचे मॉडेल कठोरपणा आणि विश्वासाची कडकपणा वाढवू शकतात, मग ते स्वत: साठी किंवा इतरांसाठी असले तरी. “(एलएलएम) ही मते हानिकारक असल्यास किंवा त्यांना स्वत: साठी किंवा इतरांसाठी हानिकारक उपाययोजना करायच्या असल्यास त्यांच्या मतांना प्रोत्साहित करू शकतात.”
.
मॉडेल्ससाठी ओपनई चाचणी कशी आणि काय बदलते
कंपनीने आपली मॉडेल्स आणि अद्यतने कशी चाचणी घ्यावी याबद्दल थोडी अंतर्दृष्टी प्रदान केली. जीपीटी -4 ओ चे हे पाचवे मुख्य अद्यतन होते, जे वर्ण आणि मदतीवर लक्ष केंद्रित करते. बदलांमध्ये प्रशिक्षण घेतल्यानंतर नवीन कामे समाविष्ट आहेत किंवा सध्याच्या मॉडेल्सवर परिष्कृत करा, त्यामध्ये वर्गीकरण आणि विविध प्रतिसादांचे मूल्यांकन यासह त्यांना अधिक स्थान देण्यात आलेल्या प्रतिसादांच्या उत्पादनास अधिक असुरक्षित बनवण्याच्या मागणीसाठी.
कोडिंग आणि गणितासारख्या विविध परिस्थितींद्वारे संभाव्य मॉडेल अद्यतनांचे त्यांच्या फायद्याचे मूल्यांकन केले जाते, तसेच तज्ञांनी प्रत्यक्ष व्यवहारात कसे वागावे यासाठी विशिष्ट चाचण्या केल्या जातात. सुरक्षितता, आरोग्य आणि धोकादायक होण्याची शक्यता असलेल्या इतर माहितीला कसे प्रतिसाद द्यायचे हे जाणून घेण्यासाठी कंपनी सुरक्षितता मूल्यांकन देखील चालवते. अखेरीस, ओपनई वास्तविक जगात ते कसे ऑफर करते हे पाहण्यासाठी लहान संख्येने वापरकर्त्यांसह ए/बी चाचण्या करीत आहे.
CHATGPT सायकोफॅन्टी खूप आहे? आपण निर्णय घ्या. (खरं सांगायचं तर आम्ही अलीकडेच आम्ही अत्यधिक भावनिक होईपर्यंत आपल्या प्रवृत्तीसाठी पीईपीला विचारले.)
या चाचण्यांमध्ये 25 एप्रिलच्या अद्ययावतची कामगिरी चांगली होती, परंतु काही तज्ञांच्या चाचणीने असे सूचित केले की हे पात्र थोडेसे दिसत होते. चाचण्या विशेषत: सायकोफॅन्सीकडे पाहिल्या गेल्या नाहीत आणि प्रयोगशाळांनी वाढवलेल्या समस्या असूनही ओपनईने पुढे जाण्याचा निर्णय घेतला. लक्षात ठेवा, वाचक: कृत्रिम बुद्धिमत्ता कंपन्या घाईत घाई करतात, ज्या चांगल्या अभ्यास केलेल्या उत्पादनांचा विकास करताना नेहमीच मागे हटत नाहीत.
कंपनीने म्हटले आहे: “परत दिल्यास, गुणात्मक मूल्यांकन एखाद्या महत्त्वाच्या गोष्टीचे संकेत दिले गेले आणि आम्ही अधिक लक्ष दिले पाहिजे,” असे कंपनीने सांगितले.
फास्ट फूडमध्ये, ओपनई म्हणाले की, विशिष्ट वर्तनाच्या समस्यांकडे लक्ष देणे आवश्यक आहे जसे की ते इतर सुरक्षा समस्या आहेत – आणि जर काही चिंता असेल तर लाँच थांबविणे. काही मॉडेल आवृत्त्यांसाठी, कंपनीने सांगितले की अधिक लाँच करण्यापूर्वी वापरकर्त्यांकडून अधिक टिप्पण्या मिळविण्यासाठी “अल्फा” स्टेज मिळेल.
एसएपी म्हणाले की एलएलएम रेटिंग वापरकर्त्यास प्रतिसाद द्यायला आवडते की नाही यावर आधारित आहे की सर्वात प्रामाणिक चॅटबॉट मिळणार नाही. नुकत्याच झालेल्या अभ्यासानुसार, एसएपी आणि इतरांना चॅटबॉटचा फायदा आणि प्रामाणिकपणा यांच्यात संघर्ष आढळला. लोकांच्या इच्छेनुसार सत्याचे प्रतिनिधित्व केले जात नाही अशा प्रकरणांशी याची तुलना करा – कार विक्री करण्याचा प्रयत्न करणार्या कार विक्री प्रतिनिधीबद्दल विचार करा.
ते म्हणाले: “येथे समस्या अशी आहे की ते मॉडेलच्या आउटपुटवर वापरकर्त्यांच्या/अंगठ्यांच्या प्रतिसादावर विश्वास ठेवत होते आणि त्यांच्याकडे काही निर्बंध आहेत कारण लोक इतरांपेक्षा वाईट काहीतरी वाढवण्याची शक्यता आहे.”
एसएपी म्हणाले की, ओपनई हे परिमाणात्मक टिप्पण्यांबद्दल अधिक टीका करणे योग्य आहे, जसे की वरच्या/खाली असलेल्या प्रतिक्रियेस, कारण ते पूर्वाग्रह वाढवू शकतात.
एसएपी म्हणाले की या समस्येमुळे कंपन्या विद्यमान वापरकर्त्यांकडे अद्यतने आणि बदल करतात ही गती देखील अधोरेखित झाली – ही समस्या जी एका तांत्रिक कंपनीपुरती मर्यादित नाही. “तंत्रज्ञान उद्योगाने खरोखरच त्याचे रिलीज केले आहे आणि प्रत्येक वापरकर्ता एक चाचणी चाचणी आहे” गोष्टींमध्ये. “प्रत्येक वापरकर्त्यास अद्यतने देण्यापूर्वी अधिक चाचण्या केल्याने या समस्या व्यापक होण्यापूर्वी ते प्रकाशित करू शकतात.
















