कृत्रिम बुद्धिमत्ता कंपन्यांना इंटरनेट इन्फ्रास्ट्रक्चर प्रदात्याने या आठवड्यात म्हटले आहे की मोठ्या भाषेच्या मॉडेल्सना प्रशिक्षण देण्यासाठी संपूर्ण वेबवर पोहोचणे कठीण होऊ शकते की ते डीफॉल्टनुसार कृत्रिम बुद्धिमत्ता डेटा रेंगाळण्यास प्रतिबंध करेल.

कृत्रिम बुद्धिमत्ता मॉडेलना प्रशिक्षण देण्यासाठी या सामग्रीचा वापर करणारे सामग्री आणि कृत्रिम बुद्धिमत्ता विकसक यांच्यात सतत लढाई सुरू करणारा हा नवीनतम आघाडी आहे. कोर्टात, लेखक आणि सामग्रीची सामग्री मुख्य कृत्रिम बुद्धिमत्ता कंपन्यांचा भरपाईसाठी दावा दाखल करते, असे सांगून कॉपीराइट सामग्री परवानगीशिवाय वापरली गेली आहे. .

आपल्याकडे अ‍ॅटलास आहे

पूर्वीच्या मॉडेल्सना प्रशिक्षण देण्यासाठी वापरल्या जाणार्‍या माहितीसाठी सामग्री सेवा प्रदाता भरपाई शोधत असताना, क्लाउडफ्लेअर चळवळ मॉडेल प्रशिक्षित करण्याच्या भविष्यातील प्रयत्नांच्या बदल्यात एक नवीन बचावात्मक उपाय दर्शवते.

परंतु ही केवळ रेंगाळण्याची बाब नाही: क्लाउडफ्लेअर म्हणतात की कृत्रिम बुद्धिमत्ता कंपन्या साइटवर रेंगाळण्यासाठी आणि स्क्रॅपिंगसाठी पैसे देऊ शकतात, ज्याचा अर्थ असा आहे की या माहितीचा प्रदाता मोबदला दिला जातो आणि कृत्रिम बुद्धिमत्तेच्या विकसकास परवानगी मिळते.

“ही सामग्री एआय इंजिन चालवणारे इंधन आहे, म्हणूनच सामग्री निर्मात्यांना त्याची थेट भरपाई होईल हे योग्य आहे,” ब्लॉग पोस्टमध्ये क्लाउडफ्लेअरचे मुख्य कार्यकारी अधिकारी मॅथ्यू ब्रिन्स म्हणाले.

वेबसाइट्सना कृत्रिम बुद्धिमत्ता रेंगाळण्यापासून का प्रतिबंधित करायचे आहे?

वेबसाइटवरून माहिती भेट आणि कॉपी करणारे क्रॉल – रोबोट्स कनेक्ट केलेल्या इंटरनेटचा एक महत्त्वपूर्ण घटक आहेत. हे असे आहे की Google सारख्या शोध इंजिन वेगवेगळ्या वेबसाइट्सवर काय आहे हे माहित आहे आणि नवीनतम माहिती सीएनईटीसारख्या ठिकाणांमधून आपली कशी सेवा देऊ शकते.

एआय क्रॉल्स वेबसाइट्ससाठी विशिष्ट आव्हाने ओळखतात. कोणासाठीही ते आक्रमक असू शकते, जे लहान साइट्ससाठी रहदारीचे असुरक्षित पातळी निर्माण करते. हे स्क्रॅपिंगवर थोडेसे बोनस देखील प्रदान करते: जर Google शोध इंजिनच्या निकालांसाठी साइट रेंगाळत असेल तर हे शक्य आहे की या साइटवरील रहदारीमध्ये शोध परिणामांमध्ये त्याचा समावेश असेल. जर लोक साइटला भेट देणे थांबवतात आणि कृत्रिम बुद्धिमत्ता मॉडेलवर अवलंबून राहतात तर कोणत्याही अतिरिक्त किंवा अगदी कमी रहदारी हालचाली प्रशिक्षणासाठी रेंगाळण्याचा अर्थ असा होऊ शकत नाही.

अधिक वाचा: कृत्रिम बुद्धिमत्ता मूलतत्त्वे: आमच्या तज्ञांच्या मते, जनरल एआय आपल्यासाठी कार्य करण्याचे 29 मार्ग

या कारणास्तव, डेटामध्ये “क्लाउडफ्लेअरच्या बीईआरडब्ल्यूआर” ला पिनटेरेस्ट, रेडडिट आणि बर्‍याच प्रमुख प्रकाशन कंपन्या (झिफा डेव्हिससह सीएनईटीच्या मालकीच्या) सारख्या प्रमुख वेबसाइट्समधील कार्यकारी अधिकारी.

रेडडिटचे मुख्य कार्यकारी अधिकारी स्टीव्ह हॉफमॅन यांनी एका निवेदनात म्हटले आहे की, “क्रॉलिंग अधिक पारदर्शक आणि देखरेख असेल तेव्हा निर्माते, प्लॅटफॉर्म, वेब वापरकर्ते आणि क्रॉल्ससाठी संपूर्ण इकोसिस्टम अधिक चांगले होईल आणि क्लाउडफ्लेअरचे प्रयत्न प्रत्येकासाठी योग्य दिशेने एक पाऊल आहेत,” रेडिटचे मुख्य कार्यकारी अधिकारी स्टीव्ह हॉफमॅन यांनी एका निवेदनात म्हटले आहे.

क्लाउडफ्लेअर जाहिरातीबद्दल विचारले असता, ओपनई म्हणाले की, त्याच्या चॅटजीपीटी मॉडेलचे उद्दीष्ट आपल्या वापरकर्त्यांना शोध इंजिनप्रमाणेच वेबवरील सामग्रीशी जोडण्यास मदत करणे आहे आणि यामुळे त्याच्या चॅट फंक्शन्सचा शोध विलीन झाला. कंपनीने असेही म्हटले आहे की क्लाउडफ्लेअरने प्रकाशकांना आर्टिफिशियल इंटेलिजेंस कसे क्रॉल केले, ज्याला रोबोट्स.टी.टी.टी.एस. ओपनई म्हणाले की रोबोट्स.टीएक्सटी मॉडेल आधीपासूनच कार्यरत आहे आणि अनावश्यक क्लाउडफ्लेअर बदलत आहे.

युद्धातून प्रशिक्षण डेटा घट्ट करा

कृत्रिम बुद्धिमत्ता मॉडेल्सना प्रशिक्षणासाठी बरीच डेटा आवश्यक आहे. अशाप्रकारे ते प्रश्नांची तपशीलवार उत्तरे देऊ शकतात आणि विस्तृत माहिती प्रदान करण्यात सभ्य कार्य (जर ते अपूर्ण असेल तर) करू शकतात. ही मॉडेल्स अविश्वसनीय माहितीवर माहिती देतात आणि या प्रशिक्षण डेटामध्ये आपण जे पहात आहात त्यावर आधारित शब्द आणि संकल्पनांमधील संपर्क साधतात.

विकसकांना हा डेटा कसा मिळाला ही समस्या आहे. आता सामग्री आणि कृत्रिम बुद्धिमत्ता कंपन्यांमध्ये डझनभर खटले आहेत. गेल्या आठवड्यात फक्त दोन मोठ्या निर्णयाचे साक्षीदार झाले.

एका प्रकरणात, फेडरल न्यायाधीशांनी अँथ्रोफिलने कायदा खर्च केला जेव्हा त्याने कॉपीराइटने संरक्षित पुस्तके तिच्या मॉडेल क्लॉडला प्रशिक्षित करण्यासाठी वापरली जेव्हा गोरा वापर नावाची संकल्पना आहे. त्याच वेळी, न्यायाधीश म्हणाले की कंपनीने पुस्तकांची कायमस्वरुपी लायब्ररी तयार केली नाही आणि त्यांनी या पायरसीच्या आरोपांवर नवीन खटला चालविला.

एका वेगळ्या प्रकरणात, न्यायाधीशांनी कंपनी आणि 13 लेखकांच्या गटामधील संघर्षाच्या व्याख्येच्या बाजूने निर्णय दिला. परंतु न्यायाधीश व्हिन्स चॅप्रिया म्हणाले की, या प्रकरणातील या निर्णयाचा अर्थ असा नाही की भविष्यातील व्याख्या किंवा इतर कृत्रिम बुद्धिमत्ता कंपन्या त्याच मार्गाने जातील. मूलभूतपणे, “या फिर्यादींनी चुकीचे युक्तिवाद सादर केले आणि योग्य रेकॉर्डचे समर्थन करण्यासाठी रेकॉर्ड विकसित करण्यात अयशस्वी.”

साइटला भेट देण्यासाठी सरीसृप चार्ज करण्याची कल्पना पूर्णपणे नवीन नाही. टोलबिट सारख्या इतर कंपन्या अशा सेवा प्रदान करतात ज्या वेबसाइट मालकांना क्रॉलिंगवर कृत्रिम बुद्धिमत्ता कंपन्या प्रदान करण्यास अनुमती देतात. टोलबिटमधील गोपनीयता आणि मीडिया कंट्रोल एआयचे अध्यक्ष len लन म्हणाले की या तंत्रज्ञानाच्या सभोवतालचे वातावरण अद्याप विकसित होत आहे. सीएनईटीने सीएनईटीला सांगितले की, “आमचा विश्वास आहे की सामग्री बाजारपेठ तयार होणे फार लवकर आहे आणि आम्ही नुकतेच येथे प्रयोग सुरू केले आहे,” सीएनईटीने सीएनईटीला सांगितले. “बर्‍याच वेगवेगळ्या मॉडेल्सची भरभराट होत असल्याचे पाहून आम्ही उत्साहित आहोत.”

सीएनईटीच्या इमाड खान यांनी या अहवालात योगदान दिले.

Source link