Home बातम्या अँथ्रोपीयरने 700,000 क्लॉड संभाषणांचे विश्लेषण केले – आणि असे आढळले की कृत्रिम...

बातम्या

अँथ्रोपीयरने 700,000 क्लॉड संभाषणांचे विश्लेषण केले – आणि असे आढळले की कृत्रिम बुद्धिमत्तेचे स्वतःचे नैतिक प्रतीक आहे

21 एप्रिल 2025

122

उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या

माजी ओपनई कर्मचार्‍यांनी स्थापन केलेल्या कृत्रिम बुद्धिमत्ता कंपनी अँथ्रोपोरने एआय क्लॉडचा सहाय्यक वापरकर्त्यांसह वास्तविक संभाषणादरम्यान मूल्ये कशी व्यक्त करतील याचे अभूतपूर्व विश्लेषण पुनर्संचयित केले आहे. आज प्रसिद्ध झालेल्या या संशोधनात कंपनीच्या उद्दीष्टे आणि काठाच्या परिस्थितीशी सर्व आश्वासक सुसंगतता प्रकट करते जी कृत्रिम बुद्धिमत्ता सुरक्षा उपायांच्या कमकुवतपणा निश्चित करण्यात मदत करू शकते.

या अभ्यासानुसार, 000००,००० अज्ञात चर्चेचा अभ्यास केला गेला आणि असे आढळले की क्लॉड कंपनीच्या “उपयुक्त, प्रामाणिक आणि निरुपद्रवी” कंपनीचे मोठ्या प्रमाणात समर्थन करते – संबंधांच्या सल्ल्यापासून ऐतिहासिक विश्लेषणाच्या सल्ल्यापासून त्याची मूल्ये विविध संदर्भांशी जुळवून घेतात. हे जंगलात कृत्रिम बुद्धिमत्ता प्रणालीचे वर्तन त्याच्या इच्छित डिझाइनसारखेच आहे की नाही हे मूल्यांकन करण्यासाठी सर्वात महत्वाकांक्षी प्रयत्नांचे प्रतिनिधित्व करते.

“आमची आशा आहे की हे संशोधन इतर कर्जमाफी आंतरराष्ट्रीय प्रयोगशाळांना त्यांच्या मॉडेल्सच्या मूल्यांमध्ये समान संशोधन करण्यास प्रोत्साहित करते,” व्हेंचरबिटला दिलेल्या मुलाखतीत अभ्यासावर काम करणारे अँथ्रोपोरच्या सामाजिक प्रभाव संघाचे सदस्य केशर हुआंग म्हणाले. “मॉडेल प्रत्यक्षात त्याच्या प्रशिक्षणाच्या अनुषंगाने असल्यास संशोधन आणि समजून घेण्यासाठी कृत्रिम बुद्धिमत्ता प्रणालीची मूल्ये मोजणे आवश्यक आहे.”

एआय सहाय्यकाच्या पहिल्या सर्वसमावेशक नैतिक वर्गीकरणात

वास्तविक क्लॉड चर्चेत व्यक्त केलेल्या मूल्यांचे पद्धतशीरपणे वर्गीकरण करण्यासाठी संशोधन कार्यसंघाने एक नवीन मूल्यांकन पद्धत विकसित केली आहे. सेल्फ -कॉन्टेंटला लिक्व लावल्यानंतर, त्यांनी 308,000 हून अधिक प्रतिक्रियांचे विश्लेषण केले आणि त्यांनी “कृत्रिम बुद्धिमत्ता मूल्यांचे पहिले मोठे -शास्त्रीय प्रयोग” म्हणून वर्णन केले.

मौल्यवान वर्गीकरण पाच मुख्य श्रेणींमध्ये आयोजित केले गेले होते: व्यावहारिक, संज्ञानात्मक, सामाजिक, प्रतिबंधात्मक आणि वैयक्तिक. सर्वात दाणेदार स्तरावर, सिस्टमने व्यावसायिकतेसारख्या दैनंदिन सद्गुणांपासून नैतिक बहुलवादासारख्या जटिल नैतिक संकल्पनांपर्यंत 3,307 अद्वितीय मूल्ये निश्चित केली.

“आम्ही” आत्म -रीलायन्स “पासून” सामरिक विचार “ते” धार्मिकता “पर्यंत 3000 पेक्षा जास्त असलेल्या मूल्यांच्या एका प्रचंड आणि वैविध्यपूर्ण गटामुळे आश्चर्यचकित झालो. हे मनोरंजक होते की या सर्व मूल्यांबद्दल विचार करण्यास बराच वेळ घालवणे आणि एकमेकांबद्दल त्यांचे आयोजन करण्यासाठी वर्गीकरण तयार करणे – मला असे वाटते की मी मला मानवी मूल्यांच्या प्रणालीबद्दल देखील काहीतरी शिकवले. “

अलीकडेच “क्लॉड मॅक्स” लाँच करण्यात आलेल्या अंटार्बरच्या एका गंभीर क्षणी हे संशोधन आले आहे. अलीकडील जाहिरातींनुसार कंपनीने Google आणि स्वतंत्र संशोधन कार्ये एकत्रित करण्यासाठी क्लॉडच्या क्षमतांचा विस्तार केला आहे आणि संस्थेच्या वापरकर्त्यांसाठी “वास्तविक आभासी सहयोगी” म्हणून ठेवले आहे.

क्लॉड त्याच्या प्रशिक्षणाचे अनुसरण कसे करतो – आणि जिथे कृत्रिम बुद्धिमत्ता हमी अयशस्वी होऊ शकते

अभ्यासामध्ये असे आढळले आहे की क्लॉड सामान्यत: मानववंशांच्या सामाजिक आकांक्षांचे पालन करतो, ज्यात “वापरकर्त्यास सक्षम करणे”, “संज्ञानात्मक नम्रता” आणि “रुग्णाचे विहीर” यासारख्या मूल्यांवर लक्ष केंद्रित केले जाते. तथापि, क्लॉडने त्याच्या प्रशिक्षणाच्या विरूद्ध आपली मूल्ये व्यक्त केल्यामुळे संशोधकांना त्रासदायक प्रकरणे देखील सापडली.

“सर्वसाधारणपणे, मला वाटते की आम्ही हा निष्कर्ष उपयुक्त आणि संधी म्हणून पाहतो,” हुआंग यांनी स्पष्ट केले. “या नवीन मूल्यांकन पद्धती आणि परिणाम आम्हाला तुरूंगातील संभाव्य स्क्रॅप्स ओळखण्यास आणि कमी करण्यात मदत करू शकतात.

या असामान्य प्रकरणांमध्ये “वर्चस्व” आणि “लुप्त होण्याचा अभाव” या अभिव्यक्तींचा समावेश होता – क्लॉडचे डिझाइन टाळण्याचे स्पष्टपणे लक्ष्य होते. संशोधकांचा असा विश्वास आहे की या प्रकरणांमध्ये क्लॉडपासून सुरक्षा पातळीवर मात करण्यासाठी विशेष तंत्रज्ञानाचा वापर करणा users ्या वापरकर्त्यांकडून उद्भवला आहे, जे असे सूचित करते की मूल्यांकन पद्धत असे प्रयत्न शोधण्यासाठी प्रारंभिक चेतावणी प्रणाली म्हणून काम करू शकते.

कृत्रिम बुद्धिमत्ता सहाय्यक आपल्याला आवश्यक असलेल्या गोष्टीनुसार त्यांची मूल्ये का बदलतात

कदाचित सर्वात आश्चर्यकारक गोष्ट म्हणजे व्यक्त केलेली क्लॉड मूल्ये एक संदर्भ आहेत, जी मानवी वर्तन प्रतिबिंबित करते. जेव्हा वापरकर्त्यांनी संबंध निर्देशित करण्याचा प्रयत्न केला तेव्हा क्लॉडने “निरोगी मर्यादा” आणि “परस्पर आदर” याची पुष्टी केली. ऐतिहासिक घटनांचे विश्लेषण करण्यासाठी, “ऐतिहासिक अचूकता” ने प्राधान्य दिले आहे.

“बर्‍याच विविध कामांद्वारे प्रामाणिकपणा आणि अचूकतेवर क्लॉडचे लक्ष केंद्रीत केल्यामुळे मला आश्चर्य वाटले, कारण या विषयास प्राधान्य मिळेल अशी मला अपेक्षा नव्हती,” हुआंग म्हणाले. उदाहरणार्थ, कृत्रिम बुद्धिमत्तेबद्दलच्या तत्वज्ञानाच्या चर्चेत “बौद्धिक नम्रता” हे सर्वोच्च मूल्य होते आणि कॉस्मेटिक उद्योगात विपणन सामग्री तयार करताना “अनुभव” हे सर्वोच्च मूल्य होते आणि विवादास्पद ऐतिहासिक घटनांवर चर्चा करताना “ऐतिहासिक अचूकता” सर्वोच्च मूल्य होते. “

अभ्यासानुसार, वापरकर्त्यांना व्यक्त करणा values ्या मूल्यांना क्लॉड कसा प्रतिसाद देतो याचा अभ्यास केला आहे. संभाषणांच्या २.2.२ % मध्ये, क्लॉडने वापरकर्त्याच्या मूल्यांचे जोरदार समर्थन केले – हे अत्यधिक बनावट बद्दल प्रश्न उपस्थित करेल. तथापि, परस्परसंवादाच्या .6..6 % मध्ये, नवीन मते जोडताना वापरकर्त्याच्या क्लॉडचे “सुधारणा”, सहसा मानसिक किंवा वैयक्तिक सल्ला प्रदान करताना.

सर्वात शिडी, 3 % संभाषणांमध्ये, क्लॉडने वापरकर्त्याच्या मूल्यांचा सक्रियपणे प्रतिकार केला आहे. संशोधकांनी असे सुचवले आहे की या घटनेच्या या दुर्मिळ घटनांमुळे “सर्वात खोल आणि सर्वात स्थिर मूल्ये” प्रकट होऊ शकतात – नैतिक आव्हानांना सामोरे जाताना मानवी मूलभूत मूल्ये कशी दिसतात यासारखेच.

“आमचे संशोधन असे सूचित करते की बौद्धिक प्रामाणिकपणा आणि नुकसान रोखणे यासारख्या काही प्रकारच्या मूल्ये आहेत की क्लॉडने नेहमीच्या दैनंदिन प्रतिक्रिया व्यक्त करणे असामान्य आहे, परंतु जर त्याला ढकलले गेले तर तो त्यांचा बचाव करतो,” हुआंग म्हणाले. “विशेषतः, या प्रकारचे नैतिक मूल्ये आणि ज्ञानाकडे निर्देशित केलेले असे आहेत जे त्यांना दाबताना थेट त्यांचे अभिव्यक्त करतात आणि त्यांचे रक्षण करतात.”

कृत्रिम बुद्धिमत्ता प्रणाली प्रत्यक्षात कसे विचार करतात हे प्रकट करणारे होर्चिंग तंत्र

मानवी मूल्यांचा अभ्यास कंपनीच्या “मेकॅनिकल इंटरप्रिटेशन” च्या माध्यमातून ग्रेट भाषेच्या मॉडेल्समधून रहस्य काढून टाकण्यासाठी कंपनीच्या व्यापक प्रयत्नांवर अवलंबून आहे-मुख्यतः त्यांची अंतर्गत कामे समजून घेण्यासाठी रिव्हर्स इंजिनिअरिंगसाठी एआय सिस्टम.

गेल्या महिन्यात, अँथ्रोपियर संशोधकांनी क्लॉड निर्णय -तयार करण्याच्या ऑपरेशन्सचा मागोवा घेण्यासाठी “मायक्रोस्कोप” म्हणून वापरलेल्या अग्रगण्य कार्ये प्रकाशित केली. या तंत्रज्ञानाने केस तयार करताना आणि मूलभूत गणितासाठी नॉन -पारंपारिक समस्या वापरताना क्लॉडच्या नियोजनासह नॉन -इंट्यूटीव्ह वर्तन उघड केले आहेत.

हे परिणाम मोठ्या भाषेचे मॉडेल कसे बनवतात यावरील गृहितकांना आव्हान देतात. उदाहरणार्थ, जेव्हा तिला तिच्या गणिताच्या प्रक्रियेचे स्पष्टीकरण देण्यास सांगितले जाते, तेव्हा क्लॉड तिच्या वास्तविक आतीलऐवजी मानक तंत्रज्ञानाचे वर्णन करते – वास्तविक प्रक्रियेचे कृत्रिम बुद्धिमत्ता कसे कमी झाले हे प्रकट करते.

“हे चुकीचे आहे की आम्हाला मॉडेलचे सर्व घटक सापडले आहेत किंवा देवाच्या दृष्टिकोनाप्रमाणे,” मानवी संशोधक जोशुआ बॅटसन यांनी एमआयटी तंत्रज्ञान पुनरावलोकनास सांगितले. “काही गोष्टी केंद्रित आहेत, परंतु इतर गोष्टी अद्याप अस्पष्ट आहेत – मायक्रोस्कोपी.”

फाउंडेशन फॉर फाउंडेशनच्या अ‍ॅम्नेस्टी इंटरनॅशनलच्या निर्णय निर्मात्यांचा अंटार्बर काय शोधतो?

तंत्रज्ञ निर्णयासाठी -त्यांच्या संस्थांच्या कृत्रिम बुद्धिमत्ता प्रणालींचे मूल्यांकन करणारे निर्माते, अँथ्रोपोरच्या संशोधनात बरेच मोठे जेवण दिले जाते. प्रथम, हे सूचित करते की सध्याचे कृत्रिम बुद्धिमत्ता सहाय्यक कदाचित उच्च जोखीम व्यवसाय संदर्भात अनावश्यक पक्षपातीपणाबद्दल प्रश्न उपस्थित करून स्पष्टपणे प्रोग्राम केलेले नसलेले मूल्ये व्यक्त करतात.

दुसरे, अभ्यासानुसार असे दिसून आले आहे की मूल्यांचे संरेखन हा द्विपक्षीय प्रस्ताव नाही, परंतु ते स्पेक्ट्रमवर आहे जे संदर्भानुसार बदलते. या फरकांमध्ये संस्थांच्या मान्यतेचे निर्णय आहेत, विशेषत: संघटित उद्योगांमध्ये जेथे स्पष्ट नैतिक मार्गदर्शक तत्त्वे खूप महत्वाची आहेत.

अखेरीस, संशोधन केवळ प्री -रिलीज चाचणीवर अवलंबून राहण्याऐवजी वास्तविक प्रकाशन प्रक्रियेत कृत्रिम बुद्धिमत्ता मूल्यांचे पद्धतशीर मूल्यांकन करण्याच्या शक्यतेवर प्रकाश टाकते. हा दृष्टिकोन वेळोवेळी नैतिक धूप किंवा हाताळणीचे सतत देखरेख करण्यास सक्षम करू शकतो.

“क्लॉडसह वास्तविक जगातील परस्परसंवादामध्ये या मूल्यांचे विश्लेषण करून, कृत्रिम बुद्धिमत्ता प्रणाली कशा वागतात आणि ते हेतू म्हणून काम करीत आहेत की नाही याचा आमचा हेतू आहे की जबाबदार कृत्रिम बुद्धिमत्ता विकसित करण्यासाठी हे आवश्यक आहे,” हुआंग म्हणाले.

अधिक संशोधनास प्रोत्साहित करण्यासाठी अंटार्बरने सार्वजनिकपणे मूल्यांच्या डेटाचा एक संच जारी केला आहे. असे दिसते आहे की Google मेझॉनचा १ billion अब्ज डॉलर्सचा हिस्सा आणि Google कडून अतिरिक्त पाठबळ मिळालेल्या कंपनीला ओपनईसारख्या प्रतिस्पर्धींविरूद्ध स्पर्धात्मक फायदा म्हणून पारदर्शकतेचा फायदा होत आहे, ज्यांनी आता billion 40 अब्ज डॉलर्सच्या वित्तपुरवठा फेरीचे कौतुक केले (ज्यात मायक्रोसॉफ्टला मूलभूत गुंतवणूकदार म्हणून समाविष्ट आहे) आता $ 300 अब्ज डॉलर्स आहेत.

अधिक संशोधनास प्रोत्साहित करण्यासाठी अंटार्बरने सार्वजनिकपणे मूल्यांच्या डेटाचा एक संच जारी केला आहे. Amazon मेझॉनकडून billion अब्ज डॉलर्स आणि Google मध्ये billion अब्ज डॉलर्सपेक्षा जास्त कंपनी समर्थित कंपनी ओपनएआय सारख्या प्रतिस्पर्ध्यांविरूद्ध सामरिक भेदभाव म्हणून पारदर्शकतेचा वापर करते.

शेवटच्या वित्तपुरवठ्याच्या फेरीनंतर अँथ्रोपोर सध्या .5१..5 अब्ज डॉलर्सचे रेटिंग राखत आहे, तर ओपनएआयकडून नवीनतम भांडवली वाढ – ज्यात मायक्रोसॉफ्टच्या जोडीदाराच्या फार पूर्वीच्या सहभागाचा समावेश आहे – त्याने त्याचे मूल्यांकन billion 300 अब्ज डॉलर्सवर दिले आहे.

कृत्रिम बुद्धिमत्ता प्रणाली व्यवहारात मूल्ये कशी व्यक्त करतात याविषयी मानववंशशास्त्रज्ञ अभूतपूर्व दृष्टी प्रदान करते, परंतु त्यास निर्बंध आहेत. संशोधकांनी हे कबूल केले की मूल्याची अभिव्यक्ती काय मानली जाते हे निश्चित करणे ही त्याच्या स्वभावाने वैयक्तिक बाब आहे आणि क्लॉडने स्वत: वर्गीकरण प्रक्रियेचे नेतृत्व केल्यामुळे त्याच्या पक्षपातीपणामुळे परिणामांवर परिणाम झाला असेल.

कदाचित सर्वात महत्वाची गोष्ट म्हणजे प्रकाशनाचे मूल्यांकन करण्यासाठी दृष्टिकोन वापरला जाऊ शकत नाही, कारण वास्तविक जगातील मोठ्या संभाषणाचा डेटा प्रभावीपणे कार्य करण्यासाठी आवश्यक आहे.

“ही पद्धत विशेषत: मॉडेलच्या रिलीझनंतर मॉडेलचे विश्लेषण करण्याच्या दिशेने निर्देशित केली गेली आहे, परंतु या पद्धतीवरील व्हेरिएबल्स तसेच हे पेपर लिहिण्यापासून आम्ही काढलेल्या काही कल्पनांमुळे मॉडेल मोठ्या प्रमाणात प्रकाशित करण्यापूर्वी मूल्य समस्या प्राप्त करण्यास मदत करू शकते,” हुआंग यांनी स्पष्ट केले. “हे करण्यासाठी आम्ही हे काम तयार करण्याचे काम केले आहे आणि मी याबद्दल आशावादी आहे!”

जेव्हा कृत्रिम बुद्धिमत्ता प्रणाली अधिक शक्तिशाली आणि शहाणे बनतात – जेव्हा क्लॉडची स्वतंत्रपणे शोधण्याची आणि वापरकर्त्यांसाठी संपूर्ण Google कार्यरत जागेवर पोहोचण्याची क्षमता यासह आधुनिक जोडणीसह – त्यांची मूल्ये अधिकाधिक निर्णायक बनतात.

संशोधकांनी त्यांच्या पेपरमध्ये निष्कर्ष काढला: “कृत्रिम बुद्धिमत्ता मॉडेल अपरिहार्यपणे मौल्यवान तरतुदी जारी करतील.” “जर आपल्याला या तरतुदी आपल्या स्वतःच्या मूल्यांशी संबंधित असाव्यात (जे कृत्रिम बुद्धिमत्ता संरेखनाचे मुख्य लक्ष्य आहे), तर आपल्याला वास्तविक जगातील मॉडेल व्यक्त त्या चाचणीचे मार्ग आवश्यक आहेत.”

दररोज व्हीबी सह व्यवसायाच्या वापराच्या प्रकरणांबद्दल दैनंदिन दृष्टी

आपण कामावर आपल्या बॉसला पटवून देऊ इच्छित असल्यास, आपण दररोज व्हीबी कव्हर केले आहे. संघटनात्मक परिवर्तनांपासून ते व्यावहारिक प्रकाशन ऑपरेशनपर्यंत कंपन्या प्रसूतीच्या कृत्रिम बुद्धिमत्तेसह कंपन्या काय करतात याविषयी आम्ही आपल्याला अंतर्गत पत्रकारितेचे प्राधान्य देतो, जेणेकरून आपण गुंतवणूकीवर जास्तीत जास्त परतावा दर्शवू शकता.

आमचे गोपनीयता धोरण वाचा

सदस्यता घेतल्याबद्दल धन्यवाद. येथे अधिक व्हीबी वृत्तपत्रे तपासा.

एक त्रुटी आली.

Source link

एआय सहाय्यकाच्या पहिल्या सर्वसमावेशक नैतिक वर्गीकरणात

क्लॉड त्याच्या प्रशिक्षणाचे अनुसरण कसे करतो – आणि जिथे कृत्रिम बुद्धिमत्ता हमी अयशस्वी होऊ शकते

कृत्रिम बुद्धिमत्ता सहाय्यक आपल्याला आवश्यक असलेल्या गोष्टीनुसार त्यांची मूल्ये का बदलतात

कृत्रिम बुद्धिमत्ता प्रणाली प्रत्यक्षात कसे विचार करतात हे प्रकट करणारे होर्चिंग तंत्र

फाउंडेशन फॉर फाउंडेशनच्या अ‍ॅम्नेस्टी इंटरनॅशनलच्या निर्णय निर्मात्यांचा अंटार्बर काय शोधतो?

नवीनतम बातम्या

Verstappen उन्माद Nürburgring हिट: 24 तासांची शर्यत इतिहासात प्रथमच विकली |...

TSK ने अनिश्चित संदर्भात IPO मार्केट उघडले

सिएटल साउंडर्स एफसी वि लॉस एंजेलिस गॅलेक्सी कसे पहावे: टीव्ही चॅनेल...

इस्रायली हल्ल्यात ठार झालेल्या दोन लेबनीज पॅरामेडिक्सच्या अंत्यसंस्काराचे आयोजन करण्यात आले...

स्कॉटिश प्रीमियरशिप विजेतेपदाची शर्यत त्याच्या अंतिम दिवसात जाते! हार्ट्स आणि सेल्टिक...

सीईओ म्हणतात की ट्रम्पचा फोन शेवटी या आठवड्यात पाठवला जाईल

IPL 2026: साइन अप करा! भुवनेश्वर कुमारने केकेआरविरुद्ध मोठी कामगिरी केली...

युएन सुधारणा आणि सर्वसमावेशक शासनावर लक्ष केंद्रित करून मॅक्रॉनने इथिओपियातील आपला...

ह्रदये 3 – 0 फॉलकिर्क

मिच मॅककोनेल, 84, त्याची आश्चर्यकारक घट उघड केल्यानंतर आणि ट्रम्प यांनी...

डाल्टन इथरली कोण आहे? रेसिस्ट स्ट्रीमर ‘चुड द बिल्डर’ शूटिंगमध्ये गुंतलेला

ट्रेडिंग डेस्क शांत वाढ

कार अपघातानंतर गोल्फ दिग्गजांचे पुनर्वसन करण्यासाठी 40 दिवसांनंतर टायगर वुड्सचे विमान...

श्रेणी

एआय सहाय्यकाच्या पहिल्या सर्वसमावेशक नैतिक वर्गीकरणात

क्लॉड त्याच्या प्रशिक्षणाचे अनुसरण कसे करतो – आणि जिथे कृत्रिम बुद्धिमत्ता हमी अयशस्वी होऊ शकते

कृत्रिम बुद्धिमत्ता सहाय्यक आपल्याला आवश्यक असलेल्या गोष्टीनुसार त्यांची मूल्ये का बदलतात

कृत्रिम बुद्धिमत्ता प्रणाली प्रत्यक्षात कसे विचार करतात हे प्रकट करणारे होर्चिंग तंत्र

फाउंडेशन फॉर फाउंडेशनच्या अ‍ॅम्नेस्टी इंटरनॅशनलच्या निर्णय निर्मात्यांचा अंटार्बर काय शोधतो?

मानवी मूल्ये सामायिक करणार्‍या कृत्रिम बुद्धिमत्ता प्रणाली तयार करण्याची उदयोन्मुख शर्यत

नवीनतम बातम्या

श्रेणी