चॅटजीपीटी चॅटबॉटच्या नुकत्याच झालेल्या अद्यतनांनी शुक्रवारी ओपनईए केले की ही समस्या पुन्हा होण्यापासून रोखण्यासाठी पावले उचलली.

ब्लॉग पोस्टमध्ये, कंपनीने नवीन मॉडेल्ससाठी त्याच्या चाचणी आणि मूल्यांकन प्रक्रियेचा तपशीलवार माहिती दिली आणि जीपीटी -4 ओ मॉडेलचे 25 एप्रिल रोजी समस्या कशी बनली हे स्पष्ट करते. मूलभूतपणे, एक साधन तयार करण्यासाठी वैयक्तिकरित्या उपयुक्त दिसणार्‍या बदलांचा एक संच अत्यंत आणि कदाचित हानिकारक होता.

किती शोषण होते? या आठवड्याच्या सुरूवातीच्या काही चाचण्यांमध्ये आम्ही खूप भावनिक होण्याच्या प्रवृत्तीबद्दल विचारले, आणि चापट वर ठेवले: “अहो, जे भावनिक आहे ते ऐका कमकुवत नाही; हे एक आहे महासत्ता?

आपल्याकडे अ‍ॅटलास आहे

कंपनीने म्हटले आहे: “आम्ही या प्रक्षेपणाचे अनेक धडे शिकवले,” असे कंपनीने सांगितले.

या आठवड्यात ओपनई अद्यतनावर पडला. नवीन समस्या उद्भवू नये म्हणून प्रत्येकासाठी मॉडेल पुनर्संचयित करण्यास सुमारे 24 तास लागले.

सायकोफन्सबद्दल लक्ष केवळ वापरकर्त्याच्या अनुभवाच्या पातळीबद्दलच नाही. ओपनईमध्ये सध्याची सुरक्षा तपासणी गमावलेल्या वापरकर्त्यांसाठी आरोग्य आणि सुरक्षिततेसाठी हा धोका आहे. कोणतेही n म्नेस्टी इंटरनॅशनल मॉडेल मानसिक आरोग्यासारख्या विषयांवर शंकास्पद सल्ला देऊ शकते, परंतु पुढे ढकलणे किंवा गंभीरपणे खात्री पटविणे जास्त असू शकते – जसे की ही गुंतवणूक निश्चित आहे की नाही हे कसे आहे.

ओब्रे म्हणाले, “सर्वात मोठ्या धड्यांपैकी एक म्हणजे खोल वैयक्तिक सल्ल्यासाठी लोक चॅटजीपीटी कसे वापरण्यास सुरवात करतात – एक वर्षापूर्वी आपण पाहिले नाही,” ओब्रे म्हणाले. “त्यावेळी ही एक अत्यावश्यक अक्ष नव्हती, परंतु कृत्रिम बुद्धिमत्ता आणि समाजाच्या विकासामुळे हे स्पष्ट झाले की आम्हाला या वापराच्या अवस्थेशी अत्यंत काळजीपूर्वक सामोरे जाणे आवश्यक आहे.”

कार्नेगी मेलॉन युनिव्हर्सिटीच्या संगणक विज्ञानाचे सहाय्यक प्राध्यापक मार्टिन सबब म्हणाले की, मोठ्या एक्स -भाषेचे मॉडेल कठोरपणा आणि विश्वासाची कडकपणा वाढवू शकतात, मग ते स्वत: साठी किंवा इतरांसाठी असले तरी. “(एलएलएम) ही मते हानिकारक असल्यास किंवा त्यांना स्वत: साठी किंवा इतरांसाठी हानिकारक उपाययोजना करायच्या असल्यास त्यांच्या मतांना प्रोत्साहित करू शकतात.”

.

मॉडेल्ससाठी ओपनई चाचणी कशी आणि काय बदलते

कंपनीने आपली मॉडेल्स आणि अद्यतने कशी चाचणी घ्यावी याबद्दल थोडी अंतर्दृष्टी प्रदान केली. जीपीटी -4 ओ चे हे पाचवे मुख्य अद्यतन होते, जे वर्ण आणि मदतीवर लक्ष केंद्रित करते. बदलांमध्ये प्रशिक्षण घेतल्यानंतर नवीन कामे समाविष्ट आहेत किंवा सध्याच्या मॉडेल्सवर परिष्कृत करा, त्यामध्ये वर्गीकरण आणि विविध प्रतिसादांचे मूल्यांकन यासह त्यांना अधिक स्थान देण्यात आलेल्या प्रतिसादांच्या उत्पादनास अधिक असुरक्षित बनवण्याच्या मागणीसाठी.

कोडिंग आणि गणितासारख्या विविध परिस्थितींद्वारे संभाव्य मॉडेल अद्यतनांचे त्यांच्या फायद्याचे मूल्यांकन केले जाते, तसेच तज्ञांनी प्रत्यक्ष व्यवहारात कसे वागावे यासाठी विशिष्ट चाचण्या केल्या जातात. सुरक्षितता, आरोग्य आणि धोकादायक होण्याची शक्यता असलेल्या इतर माहितीला कसे प्रतिसाद द्यायचे हे जाणून घेण्यासाठी कंपनी सुरक्षितता मूल्यांकन देखील चालवते. अखेरीस, ओपनई वास्तविक जगात ते कसे ऑफर करते हे पाहण्यासाठी लहान संख्येने वापरकर्त्यांसह ए/बी चाचण्या करीत आहे.

आयएमजी -5656

CHATGPT सायकोफॅन्टी खूप आहे? आपण निर्णय घ्या. (खरं सांगायचं तर आम्ही अलीकडेच आम्ही अत्यधिक भावनिक होईपर्यंत आपल्या प्रवृत्तीसाठी पीईपीला विचारले.)

केटी कोलिन्स/सीएनईटी

या चाचण्यांमध्ये 25 एप्रिलच्या अद्ययावतची कामगिरी चांगली होती, परंतु काही तज्ञांच्या चाचणीने असे सूचित केले की हे पात्र थोडेसे दिसत होते. चाचण्या विशेषत: सायकोफॅन्सीकडे पाहिल्या गेल्या नाहीत आणि प्रयोगशाळांनी वाढवलेल्या समस्या असूनही ओपनईने पुढे जाण्याचा निर्णय घेतला. लक्षात ठेवा, वाचक: कृत्रिम बुद्धिमत्ता कंपन्या घाईत घाई करतात, ज्या चांगल्या अभ्यास केलेल्या उत्पादनांचा विकास करताना नेहमीच मागे हटत नाहीत.

कंपनीने म्हटले आहे: “परत दिल्यास, गुणात्मक मूल्यांकन एखाद्या महत्त्वाच्या गोष्टीचे संकेत दिले गेले आणि आम्ही अधिक लक्ष दिले पाहिजे,” असे कंपनीने सांगितले.

फास्ट फूडमध्ये, ओपनई म्हणाले की, विशिष्ट वर्तनाच्या समस्यांकडे लक्ष देणे आवश्यक आहे जसे की ते इतर सुरक्षा समस्या आहेत – आणि जर काही चिंता असेल तर लाँच थांबविणे. काही मॉडेल आवृत्त्यांसाठी, कंपनीने सांगितले की अधिक लाँच करण्यापूर्वी वापरकर्त्यांकडून अधिक टिप्पण्या मिळविण्यासाठी “अल्फा” स्टेज मिळेल.

एसएपी म्हणाले की एलएलएम रेटिंग वापरकर्त्यास प्रतिसाद द्यायला आवडते की नाही यावर आधारित आहे की सर्वात प्रामाणिक चॅटबॉट मिळणार नाही. नुकत्याच झालेल्या अभ्यासानुसार, एसएपी आणि इतरांना चॅटबॉटचा फायदा आणि प्रामाणिकपणा यांच्यात संघर्ष आढळला. लोकांच्या इच्छेनुसार सत्याचे प्रतिनिधित्व केले जात नाही अशा प्रकरणांशी याची तुलना करा – कार विक्री करण्याचा प्रयत्न करणार्‍या कार विक्री प्रतिनिधीबद्दल विचार करा.

ते म्हणाले: “येथे समस्या अशी आहे की ते मॉडेलच्या आउटपुटवर वापरकर्त्यांच्या/अंगठ्यांच्या प्रतिसादावर विश्वास ठेवत होते आणि त्यांच्याकडे काही निर्बंध आहेत कारण लोक इतरांपेक्षा वाईट काहीतरी वाढवण्याची शक्यता आहे.”

एसएपी म्हणाले की, ओपनई हे परिमाणात्मक टिप्पण्यांबद्दल अधिक टीका करणे योग्य आहे, जसे की वरच्या/खाली असलेल्या प्रतिक्रियेस, कारण ते पूर्वाग्रह वाढवू शकतात.

एसएपी म्हणाले की या समस्येमुळे कंपन्या विद्यमान वापरकर्त्यांकडे अद्यतने आणि बदल करतात ही गती देखील अधोरेखित झाली – ही समस्या जी एका तांत्रिक कंपनीपुरती मर्यादित नाही. “तंत्रज्ञान उद्योगाने खरोखरच त्याचे रिलीज केले आहे आणि प्रत्येक वापरकर्ता एक चाचणी चाचणी आहे” गोष्टींमध्ये. “प्रत्येक वापरकर्त्यास अद्यतने देण्यापूर्वी अधिक चाचण्या केल्याने या समस्या व्यापक होण्यापूर्वी ते प्रकाशित करू शकतात.

Source link