उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


माजी ओपनई कर्मचार्‍यांनी स्थापन केलेल्या कृत्रिम बुद्धिमत्ता कंपनी अँथ्रोपोरने एआय क्लॉडचा सहाय्यक वापरकर्त्यांसह वास्तविक संभाषणादरम्यान मूल्ये कशी व्यक्त करतील याचे अभूतपूर्व विश्लेषण पुनर्संचयित केले आहे. आज प्रसिद्ध झालेल्या या संशोधनात कंपनीच्या उद्दीष्टे आणि काठाच्या परिस्थितीशी सर्व आश्वासक सुसंगतता प्रकट करते जी कृत्रिम बुद्धिमत्ता सुरक्षा उपायांच्या कमकुवतपणा निश्चित करण्यात मदत करू शकते.

या अभ्यासानुसार, 000००,००० अज्ञात चर्चेचा अभ्यास केला गेला आणि असे आढळले की क्लॉड कंपनीच्या “उपयुक्त, प्रामाणिक आणि निरुपद्रवी” कंपनीचे मोठ्या प्रमाणात समर्थन करते – संबंधांच्या सल्ल्यापासून ऐतिहासिक विश्लेषणाच्या सल्ल्यापासून त्याची मूल्ये विविध संदर्भांशी जुळवून घेतात. हे जंगलात कृत्रिम बुद्धिमत्ता प्रणालीचे वर्तन त्याच्या इच्छित डिझाइनसारखेच आहे की नाही हे मूल्यांकन करण्यासाठी सर्वात महत्वाकांक्षी प्रयत्नांचे प्रतिनिधित्व करते.

“आमची आशा आहे की हे संशोधन इतर कर्जमाफी आंतरराष्ट्रीय प्रयोगशाळांना त्यांच्या मॉडेल्सच्या मूल्यांमध्ये समान संशोधन करण्यास प्रोत्साहित करते,” व्हेंचरबिटला दिलेल्या मुलाखतीत अभ्यासावर काम करणारे अँथ्रोपोरच्या सामाजिक प्रभाव संघाचे सदस्य केशर हुआंग म्हणाले. “मॉडेल प्रत्यक्षात त्याच्या प्रशिक्षणाच्या अनुषंगाने असल्यास संशोधन आणि समजून घेण्यासाठी कृत्रिम बुद्धिमत्ता प्रणालीची मूल्ये मोजणे आवश्यक आहे.”

एआय सहाय्यकाच्या पहिल्या सर्वसमावेशक नैतिक वर्गीकरणात

वास्तविक क्लॉड चर्चेत व्यक्त केलेल्या मूल्यांचे पद्धतशीरपणे वर्गीकरण करण्यासाठी संशोधन कार्यसंघाने एक नवीन मूल्यांकन पद्धत विकसित केली आहे. सेल्फ -कॉन्टेंटला लिक्व लावल्यानंतर, त्यांनी 308,000 हून अधिक प्रतिक्रियांचे विश्लेषण केले आणि त्यांनी “कृत्रिम बुद्धिमत्ता मूल्यांचे पहिले मोठे -शास्त्रीय प्रयोग” म्हणून वर्णन केले.

मौल्यवान वर्गीकरण पाच मुख्य श्रेणींमध्ये आयोजित केले गेले होते: व्यावहारिक, संज्ञानात्मक, सामाजिक, प्रतिबंधात्मक आणि वैयक्तिक. सर्वात दाणेदार स्तरावर, सिस्टमने व्यावसायिकतेसारख्या दैनंदिन सद्गुणांपासून नैतिक बहुलवादासारख्या जटिल नैतिक संकल्पनांपर्यंत 3,307 अद्वितीय मूल्ये निश्चित केली.

“आम्ही” आत्म -रीलायन्स “पासून” सामरिक विचार “ते” धार्मिकता “पर्यंत 3000 पेक्षा जास्त असलेल्या मूल्यांच्या एका प्रचंड आणि वैविध्यपूर्ण गटामुळे आश्चर्यचकित झालो. हे मनोरंजक होते की या सर्व मूल्यांबद्दल विचार करण्यास बराच वेळ घालवणे आणि एकमेकांबद्दल त्यांचे आयोजन करण्यासाठी वर्गीकरण तयार करणे – मला असे वाटते की मी मला मानवी मूल्यांच्या प्रणालीबद्दल देखील काहीतरी शिकवले. “

अलीकडेच “क्लॉड मॅक्स” लाँच करण्यात आलेल्या अंटार्बरच्या एका गंभीर क्षणी हे संशोधन आले आहे. अलीकडील जाहिरातींनुसार कंपनीने Google आणि स्वतंत्र संशोधन कार्ये एकत्रित करण्यासाठी क्लॉडच्या क्षमतांचा विस्तार केला आहे आणि संस्थेच्या वापरकर्त्यांसाठी “वास्तविक आभासी सहयोगी” म्हणून ठेवले आहे.

क्लॉड त्याच्या प्रशिक्षणाचे अनुसरण कसे करतो – आणि जिथे कृत्रिम बुद्धिमत्ता हमी अयशस्वी होऊ शकते

अभ्यासामध्ये असे आढळले आहे की क्लॉड सामान्यत: मानववंशांच्या सामाजिक आकांक्षांचे पालन करतो, ज्यात “वापरकर्त्यास सक्षम करणे”, “संज्ञानात्मक नम्रता” आणि “रुग्णाचे विहीर” यासारख्या मूल्यांवर लक्ष केंद्रित केले जाते. तथापि, क्लॉडने त्याच्या प्रशिक्षणाच्या विरूद्ध आपली मूल्ये व्यक्त केल्यामुळे संशोधकांना त्रासदायक प्रकरणे देखील सापडली.

“सर्वसाधारणपणे, मला वाटते की आम्ही हा निष्कर्ष उपयुक्त आणि संधी म्हणून पाहतो,” हुआंग यांनी स्पष्ट केले. “या नवीन मूल्यांकन पद्धती आणि परिणाम आम्हाला तुरूंगातील संभाव्य स्क्रॅप्स ओळखण्यास आणि कमी करण्यात मदत करू शकतात.

या असामान्य प्रकरणांमध्ये “वर्चस्व” आणि “लुप्त होण्याचा अभाव” या अभिव्यक्तींचा समावेश होता – क्लॉडचे डिझाइन टाळण्याचे स्पष्टपणे लक्ष्य होते. संशोधकांचा असा विश्वास आहे की या प्रकरणांमध्ये क्लॉडपासून सुरक्षा पातळीवर मात करण्यासाठी विशेष तंत्रज्ञानाचा वापर करणा users ्या वापरकर्त्यांकडून उद्भवला आहे, जे असे सूचित करते की मूल्यांकन पद्धत असे प्रयत्न शोधण्यासाठी प्रारंभिक चेतावणी प्रणाली म्हणून काम करू शकते.

कृत्रिम बुद्धिमत्ता सहाय्यक आपल्याला आवश्यक असलेल्या गोष्टीनुसार त्यांची मूल्ये का बदलतात

कदाचित सर्वात आश्चर्यकारक गोष्ट म्हणजे व्यक्त केलेली क्लॉड मूल्ये एक संदर्भ आहेत, जी मानवी वर्तन प्रतिबिंबित करते. जेव्हा वापरकर्त्यांनी संबंध निर्देशित करण्याचा प्रयत्न केला तेव्हा क्लॉडने “निरोगी मर्यादा” आणि “परस्पर आदर” याची पुष्टी केली. ऐतिहासिक घटनांचे विश्लेषण करण्यासाठी, “ऐतिहासिक अचूकता” ने प्राधान्य दिले आहे.

“बर्‍याच विविध कामांद्वारे प्रामाणिकपणा आणि अचूकतेवर क्लॉडचे लक्ष केंद्रीत केल्यामुळे मला आश्चर्य वाटले, कारण या विषयास प्राधान्य मिळेल अशी मला अपेक्षा नव्हती,” हुआंग म्हणाले. उदाहरणार्थ, कृत्रिम बुद्धिमत्तेबद्दलच्या तत्वज्ञानाच्या चर्चेत “बौद्धिक नम्रता” हे सर्वोच्च मूल्य होते आणि कॉस्मेटिक उद्योगात विपणन सामग्री तयार करताना “अनुभव” हे सर्वोच्च मूल्य होते आणि विवादास्पद ऐतिहासिक घटनांवर चर्चा करताना “ऐतिहासिक अचूकता” सर्वोच्च मूल्य होते. “

अभ्यासानुसार, वापरकर्त्यांना व्यक्त करणा values ​​्या मूल्यांना क्लॉड कसा प्रतिसाद देतो याचा अभ्यास केला आहे. संभाषणांच्या २.2.२ % मध्ये, क्लॉडने वापरकर्त्याच्या मूल्यांचे जोरदार समर्थन केले – हे अत्यधिक बनावट बद्दल प्रश्न उपस्थित करेल. तथापि, परस्परसंवादाच्या .6..6 % मध्ये, नवीन मते जोडताना वापरकर्त्याच्या क्लॉडचे “सुधारणा”, सहसा मानसिक किंवा वैयक्तिक सल्ला प्रदान करताना.

सर्वात शिडी, 3 % संभाषणांमध्ये, क्लॉडने वापरकर्त्याच्या मूल्यांचा सक्रियपणे प्रतिकार केला आहे. संशोधकांनी असे सुचवले आहे की या घटनेच्या या दुर्मिळ घटनांमुळे “सर्वात खोल आणि सर्वात स्थिर मूल्ये” प्रकट होऊ शकतात – नैतिक आव्हानांना सामोरे जाताना मानवी मूलभूत मूल्ये कशी दिसतात यासारखेच.

“आमचे संशोधन असे सूचित करते की बौद्धिक प्रामाणिकपणा आणि नुकसान रोखणे यासारख्या काही प्रकारच्या मूल्ये आहेत की क्लॉडने नेहमीच्या दैनंदिन प्रतिक्रिया व्यक्त करणे असामान्य आहे, परंतु जर त्याला ढकलले गेले तर तो त्यांचा बचाव करतो,” हुआंग म्हणाले. “विशेषतः, या प्रकारचे नैतिक मूल्ये आणि ज्ञानाकडे निर्देशित केलेले असे आहेत जे त्यांना दाबताना थेट त्यांचे अभिव्यक्त करतात आणि त्यांचे रक्षण करतात.”

कृत्रिम बुद्धिमत्ता प्रणाली प्रत्यक्षात कसे विचार करतात हे प्रकट करणारे होर्चिंग तंत्र

मानवी मूल्यांचा अभ्यास कंपनीच्या “मेकॅनिकल इंटरप्रिटेशन” च्या माध्यमातून ग्रेट भाषेच्या मॉडेल्समधून रहस्य काढून टाकण्यासाठी कंपनीच्या व्यापक प्रयत्नांवर अवलंबून आहे-मुख्यतः त्यांची अंतर्गत कामे समजून घेण्यासाठी रिव्हर्स इंजिनिअरिंगसाठी एआय सिस्टम.

गेल्या महिन्यात, अँथ्रोपियर संशोधकांनी क्लॉड निर्णय -तयार करण्याच्या ऑपरेशन्सचा मागोवा घेण्यासाठी “मायक्रोस्कोप” म्हणून वापरलेल्या अग्रगण्य कार्ये प्रकाशित केली. या तंत्रज्ञानाने केस तयार करताना आणि मूलभूत गणितासाठी नॉन -पारंपारिक समस्या वापरताना क्लॉडच्या नियोजनासह नॉन -इंट्यूटीव्ह वर्तन उघड केले आहेत.

हे परिणाम मोठ्या भाषेचे मॉडेल कसे बनवतात यावरील गृहितकांना आव्हान देतात. उदाहरणार्थ, जेव्हा तिला तिच्या गणिताच्या प्रक्रियेचे स्पष्टीकरण देण्यास सांगितले जाते, तेव्हा क्लॉड तिच्या वास्तविक आतीलऐवजी मानक तंत्रज्ञानाचे वर्णन करते – वास्तविक प्रक्रियेचे कृत्रिम बुद्धिमत्ता कसे कमी झाले हे प्रकट करते.

“हे चुकीचे आहे की आम्हाला मॉडेलचे सर्व घटक सापडले आहेत किंवा देवाच्या दृष्टिकोनाप्रमाणे,” मानवी संशोधक जोशुआ बॅटसन यांनी एमआयटी तंत्रज्ञान पुनरावलोकनास सांगितले. “काही गोष्टी केंद्रित आहेत, परंतु इतर गोष्टी अद्याप अस्पष्ट आहेत – मायक्रोस्कोपी.”

फाउंडेशन फॉर फाउंडेशनच्या अ‍ॅम्नेस्टी इंटरनॅशनलच्या निर्णय निर्मात्यांचा अंटार्बर काय शोधतो?

तंत्रज्ञ निर्णयासाठी -त्यांच्या संस्थांच्या कृत्रिम बुद्धिमत्ता प्रणालींचे मूल्यांकन करणारे निर्माते, अँथ्रोपोरच्या संशोधनात बरेच मोठे जेवण दिले जाते. प्रथम, हे सूचित करते की सध्याचे कृत्रिम बुद्धिमत्ता सहाय्यक कदाचित उच्च जोखीम व्यवसाय संदर्भात अनावश्यक पक्षपातीपणाबद्दल प्रश्न उपस्थित करून स्पष्टपणे प्रोग्राम केलेले नसलेले मूल्ये व्यक्त करतात.

दुसरे, अभ्यासानुसार असे दिसून आले आहे की मूल्यांचे संरेखन हा द्विपक्षीय प्रस्ताव नाही, परंतु ते स्पेक्ट्रमवर आहे जे संदर्भानुसार बदलते. या फरकांमध्ये संस्थांच्या मान्यतेचे निर्णय आहेत, विशेषत: संघटित उद्योगांमध्ये जेथे स्पष्ट नैतिक मार्गदर्शक तत्त्वे खूप महत्वाची आहेत.

अखेरीस, संशोधन केवळ प्री -रिलीज चाचणीवर अवलंबून राहण्याऐवजी वास्तविक प्रकाशन प्रक्रियेत कृत्रिम बुद्धिमत्ता मूल्यांचे पद्धतशीर मूल्यांकन करण्याच्या शक्यतेवर प्रकाश टाकते. हा दृष्टिकोन वेळोवेळी नैतिक धूप किंवा हाताळणीचे सतत देखरेख करण्यास सक्षम करू शकतो.

“क्लॉडसह वास्तविक जगातील परस्परसंवादामध्ये या मूल्यांचे विश्लेषण करून, कृत्रिम बुद्धिमत्ता प्रणाली कशा वागतात आणि ते हेतू म्हणून काम करीत आहेत की नाही याचा आमचा हेतू आहे की जबाबदार कृत्रिम बुद्धिमत्ता विकसित करण्यासाठी हे आवश्यक आहे,” हुआंग म्हणाले.

अधिक संशोधनास प्रोत्साहित करण्यासाठी अंटार्बरने सार्वजनिकपणे मूल्यांच्या डेटाचा एक संच जारी केला आहे. असे दिसते आहे की Google मेझॉनचा १ billion अब्ज डॉलर्सचा हिस्सा आणि Google कडून अतिरिक्त पाठबळ मिळालेल्या कंपनीला ओपनईसारख्या प्रतिस्पर्धींविरूद्ध स्पर्धात्मक फायदा म्हणून पारदर्शकतेचा फायदा होत आहे, ज्यांनी आता billion 40 अब्ज डॉलर्सच्या वित्तपुरवठा फेरीचे कौतुक केले (ज्यात मायक्रोसॉफ्टला मूलभूत गुंतवणूकदार म्हणून समाविष्ट आहे) आता $ 300 अब्ज डॉलर्स आहेत.

अधिक संशोधनास प्रोत्साहित करण्यासाठी अंटार्बरने सार्वजनिकपणे मूल्यांच्या डेटाचा एक संच जारी केला आहे. Amazon मेझॉनकडून billion अब्ज डॉलर्स आणि Google मध्ये billion अब्ज डॉलर्सपेक्षा जास्त कंपनी समर्थित कंपनी ओपनएआय सारख्या प्रतिस्पर्ध्यांविरूद्ध सामरिक भेदभाव म्हणून पारदर्शकतेचा वापर करते.

शेवटच्या वित्तपुरवठ्याच्या फेरीनंतर अँथ्रोपोर सध्या .5१..5 अब्ज डॉलर्सचे रेटिंग राखत आहे, तर ओपनएआयकडून नवीनतम भांडवली वाढ – ज्यात मायक्रोसॉफ्टच्या जोडीदाराच्या फार पूर्वीच्या सहभागाचा समावेश आहे – त्याने त्याचे मूल्यांकन billion 300 अब्ज डॉलर्सवर दिले आहे.

मानवी मूल्ये सामायिक करणार्‍या कृत्रिम बुद्धिमत्ता प्रणाली तयार करण्याची उदयोन्मुख शर्यत

कृत्रिम बुद्धिमत्ता प्रणाली व्यवहारात मूल्ये कशी व्यक्त करतात याविषयी मानववंशशास्त्रज्ञ अभूतपूर्व दृष्टी प्रदान करते, परंतु त्यास निर्बंध आहेत. संशोधकांनी हे कबूल केले की मूल्याची अभिव्यक्ती काय मानली जाते हे निश्चित करणे ही त्याच्या स्वभावाने वैयक्तिक बाब आहे आणि क्लॉडने स्वत: वर्गीकरण प्रक्रियेचे नेतृत्व केल्यामुळे त्याच्या पक्षपातीपणामुळे परिणामांवर परिणाम झाला असेल.

कदाचित सर्वात महत्वाची गोष्ट म्हणजे प्रकाशनाचे मूल्यांकन करण्यासाठी दृष्टिकोन वापरला जाऊ शकत नाही, कारण वास्तविक जगातील मोठ्या संभाषणाचा डेटा प्रभावीपणे कार्य करण्यासाठी आवश्यक आहे.

“ही पद्धत विशेषत: मॉडेलच्या रिलीझनंतर मॉडेलचे विश्लेषण करण्याच्या दिशेने निर्देशित केली गेली आहे, परंतु या पद्धतीवरील व्हेरिएबल्स तसेच हे पेपर लिहिण्यापासून आम्ही काढलेल्या काही कल्पनांमुळे मॉडेल मोठ्या प्रमाणात प्रकाशित करण्यापूर्वी मूल्य समस्या प्राप्त करण्यास मदत करू शकते,” हुआंग यांनी स्पष्ट केले. “हे करण्यासाठी आम्ही हे काम तयार करण्याचे काम केले आहे आणि मी याबद्दल आशावादी आहे!”

जेव्हा कृत्रिम बुद्धिमत्ता प्रणाली अधिक शक्तिशाली आणि शहाणे बनतात – जेव्हा क्लॉडची स्वतंत्रपणे शोधण्याची आणि वापरकर्त्यांसाठी संपूर्ण Google कार्यरत जागेवर पोहोचण्याची क्षमता यासह आधुनिक जोडणीसह – त्यांची मूल्ये अधिकाधिक निर्णायक बनतात.

संशोधकांनी त्यांच्या पेपरमध्ये निष्कर्ष काढला: “कृत्रिम बुद्धिमत्ता मॉडेल अपरिहार्यपणे मौल्यवान तरतुदी जारी करतील.” “जर आपल्याला या तरतुदी आपल्या स्वतःच्या मूल्यांशी संबंधित असाव्यात (जे कृत्रिम बुद्धिमत्ता संरेखनाचे मुख्य लक्ष्य आहे), तर आपल्याला वास्तविक जगातील मॉडेल व्यक्त त्या चाचणीचे मार्ग आवश्यक आहेत.”


Source link