उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
संस्था वेळ आणि रॅग (आरएजी) जनरेशन सिस्टमवर पैसे तयार करण्यासाठी वेळ घालवतात. अचूक एआयची अचूक प्रणाली असणे हे ध्येय आहे, परंतु या प्रणाली प्रत्यक्षात कार्य करतात?
रॅग सिस्टम आधीपासूनच कार्यरत आहेत की नाही हे माझे उद्दीष्ट मोजण्याची असमर्थता एक गंभीर आंधळा बिंदू आहे. आज या आव्हानाचे संभाव्य निराकरण ओपन रॅग इव्हल ओपन सोर्सच्या उदयासह सुरू केले आहे. वॉटरलू युनिव्हर्सिटीमधील प्रोफेसर जिमी लिन आणि त्यांच्या संशोधन पथकासह कार्य करणारे रॅग एंटेरिस प्लॅटफॉर्मवरून वेक्टरने नवीन चौकट विकसित केले आहे.
ओपन रॅग इव्हल “हे” बदलते “हे कठोर आणि पुनरावृत्ती मूल्यांकन पद्धतीशी तुलना करण्याच्या दृष्टिकोनापेक्षा चांगले आहे जे पुनर्प्राप्तीची अचूकता, संस्थांच्या आरएजीद्वारे प्रसूतिशास्त्र आणि भ्रमांची गुणवत्ता मोजू शकते.
फ्रेमवर्क ही दोन मुख्य मेट्रिक श्रेणींचा वापर करून प्रतिसाद गुणवत्ता आहे: पुनर्प्राप्ती उपाय आणि प्रसूती उपाय. व्हेक्टर प्लॅटफॉर्म किंवा विशेष डिझाइन केलेले समाधान वापरणे असो, संस्थांना हे मूल्यांकन कोणत्याही आरएजी पाइपलाइनवर लागू करण्याची परवानगी आहे. तांत्रिक निर्णय निर्मात्यांसाठी, शेवटी याचा अर्थ असा आहे की आपल्याकडे त्यांचे आरोग अनुप्रयोग निश्चित करण्यासाठी एक पद्धतशीर पद्धत आहे.
“जर आपण हे मोजू शकत नाही तर आपण त्यात सुधारणा करू शकत नाही,” वॉटरलो विद्यापीठातील प्राध्यापक जिमी लिन यांनी एका विशेष मुलाखतीत सांगितले. “माहितीमध्ये, आपण बर्याच गोष्टी मोजू शकता, एनडीसीजी (कमी संचयी फायद्याचे), अचूकता, लक्षात ठेवा … परंतु जेव्हा योग्य उत्तरांचा विचार केला जातो तेव्हा आमच्याकडे कोणताही मार्ग नव्हता आणि या कारणास्तव आम्ही हा मार्ग सुरू केला.”
एआय एंटरप्राइझचा अवलंब करण्यासाठी बॉटलनेक रॅगचे मूल्यांकन का आहे?
विक्तारा रॅगच्या क्षेत्रातील प्रारंभिक पायनियर होता. ऑक्टोबर 2022 मध्ये कंपनी सुरू केली गेली होती, चॅटजीपीटी एक परिचित नाव होते. रॅग शॉर्टकट वापरण्यापूर्वी वेक्टारा आधीपासूनच तंत्रज्ञानामध्ये दिसला आहे ज्याला मूळतः मे 2023 मध्ये पृथ्वीवर एआय म्हणून संबोधले गेले होते.
गेल्या काही महिन्यांपासून, बर्याच संस्थांसाठी, रॅग अनुप्रयोग वाढत्या आणि मूल्यांकन करणे कठीण झाले आहे. मुख्य आव्हान असे आहे की संस्था मल्टी -स्टेप एजंट सिस्टमच्या प्रश्नांच्या सोप्या उत्तरांच्या पलीकडे जातात.
“कार्यात्मक जगात, मूल्यांकन दुप्पट महत्वाचे आहे, कारण कृत्रिम बुद्धिमत्ता एजंट्स अनेक चरण आहेत,” वेक्टाराचे मुख्य कार्यकारी अधिकारी आणि व्हेंचरबीटचे संस्थापक अॅम अवदल्लाह म्हणाले. “जर आपण पहिल्या चरणात भ्रम अटक केली नाही तर हे दुसर्या चरणात लक्ष केंद्रित करते, तिसर्या चरणात प्रतिनिधित्व करते आणि आपण पाइपलाइनच्या शेवटी चुकीच्या प्रक्रियेसह किंवा उत्तर दिले.”
रॅक इव्हर्स कसे कार्य करतात: ब्लॅक बॉक्स मोजण्यायोग्य घटकांमध्ये खंडित करा
ओपन रॅग इव्हल फ्रेमवर्क वस्तुमान पद्धतीद्वारे मूल्यांकनकडे येत आहे.
लिनने स्पष्ट केले की ब्लॉकचा दृष्टिकोन मूलभूत तथ्यांमधील प्रतिसाद तोडतो आणि नंतर नग्जेट्स उचलणार्या सिस्टमची प्रभावीता मोजतो.
फ्रेम चार विशिष्ट मानकांद्वारे रॅग सिस्टमचे मूल्यांकन करते:
- भ्रम शोध हे स्रोत दस्तऐवजांद्वारे समर्थित नसलेल्या बनावट माहितीवर तयार केलेल्या सामग्रीमध्ये असलेली डिग्री मोजते.
- कोट – स्त्रोत दस्तऐवजांसह प्रतिसादकर्त्यांचे समर्थन कसे करावे हे ठरवते.
- कार ब्लॉक तयार केलेल्या निवडणुकांमध्ये स्त्रोत दस्तऐवजांच्या मूलभूत माहितीच्या गाळेची उपस्थिती.
- छत्री (मोजमापाच्या मोजमापाचे मूल्यांकन करण्यासाठी एक युनिफाइड पद्धत
महत्त्वाचे म्हणजे, फ्रेमने संपूर्ण रॅग पाइपलाइन एका बाजूपासून शेवटपर्यंत सेट केली, जे मॉडेल, पुनर्प्राप्ती प्रणाली, कटिंग स्ट्रॅटेजीज आणि एलएलएमशी अंतिम आउटपुट तयार करण्यासाठी कसे संवाद साधता येईल याविषयी एक दृष्टी प्रदान करते.
तांत्रिक नावीन्यपूर्ण: एलएलएमद्वारे ऑटोमेशन
तांत्रिकदृष्ट्या ओपन रॅग इव्हल काय बनवते ते म्हणजे पूर्वीची जाड मॅन्युअल मूल्यांकन प्रक्रिया स्वयंचलित करण्यासाठी मोठ्या भाषेचे मॉडेल कसे वापरावे.
“योग्य तुलनेत आम्ही प्रारंभ करण्यापूर्वी तांत्रिक स्थिती शिल्लक होती.” “तेच आहे, तुला डावे अधिक चांगले आवडते? तुम्हाला सर्वोत्कृष्ट बरोबर आहे का? किंवा दोघेही चांगले आहेत की ते वाईट आहेत? गोष्टी करण्याचा हा एक प्रकारचा मार्ग होता.”
लिनने नमूद केले की स्वतःच मोठ्या प्रमाणात मूल्यांकन करण्याचा दृष्टीकोन ही नवीन गोष्ट नाही, परंतु एलएलएमद्वारे त्याचे ऑटोमेशन एक प्रवेश आहे.
फ्रेमवर्क पायथनचा उपयोग प्रगत वेगवान अभियांत्रिकीसह एलएलएम मिळविण्यासाठी केला जातो जसे की नग्जेट्स आणि हॅलूसिनोजेनिक मूल्यांकन निश्चित करणे, सर्व संघटित मूल्यांकन पाइपलाइनमध्ये लपेटलेले.
स्पर्धात्मक देखावा: रॅट इव्हल ओपन कसे मूल्यांकन करण्यासाठी साम्राज्यात फिट होते
संस्था कृत्रिम बुद्धिमत्ता वापरत असताना, मूल्यांकन फ्रेमवर्कची संख्या वाढत आहे. केवळ गेल्या आठवड्यातच, मिगिंग फेस यूबेंचने कंपनीच्या अंतर्गत डेटाच्या विरूद्ध मॉडेल्सची चाचणी घेण्यासाठी लाँच केले. जानेवारीच्या शेवटी, गॅलिलियोने एजंट मूल्यांकन तंत्र सुरू केले.
खुल्या तुकड्यांचे मूल्यांकन बदलते कारण ते आरएजी पाइपलाइनवर अत्यंत केंद्रित आहे आणि केवळ एलएलएम आउटपुटच नाही .. फ्रेममध्ये एक मजबूत शैक्षणिक आधार देखील आहे आणि नियुक्त केलेल्या पद्धतीऐवजी निश्चित माहिती पुनर्प्राप्त करण्याच्या विज्ञानावर आधारित आहे.
फ्रेमवर्क ओपन सोर्स एआय समुदायाच्या मागील वेक्टरच्या योगदानावर अवलंबून आहे, ज्यात एचएचईएम एचएचईएमचा समावेश आहे, जो मिठीच्या तोंडावर million. Million दशलक्ष वेळा डाउनलोड केला गेला आहे आणि हॅलूसिनोजेनिक शोधण्यासाठी एक मानक बनला आहे.
“आम्ही याला वेक्टारा इव्हल फ्रेमवर्क म्हणत नाही, आम्ही याला ओपन रॅग इव्हल फ्रेमवर्क म्हणतो कारण आम्हाला इतर कंपन्या आणि इतर संस्था खरोखरच तयार करावीत अशी आमची इच्छा आहे,” अवद अल्लाहने पुष्टी केली. “या प्रणालींना योग्य मार्गाने विकसित करण्यासाठी आपल्या सर्वांसाठी बाजारात आम्हाला असे काहीतरी हवे आहे.”
वास्तविक जगात ओपन रॅग म्हणजे काय?
जरी हे अद्याप स्टेजसाठी एक प्रारंभिक प्रयत्न आहे, तरी कमीतकमी वेक्टाराकडे आधीपासूनच बर्याच वापरकर्त्यांना ओपन रॅग इव्हल फ्रेम वापरण्यास रस आहे.
त्यापैकी कोठेही रिअल इस्टेट कंपनीचे एसव्हीपी उत्पादने आणि तंत्रज्ञान जेफ हॅमल आहे. हम्मेलने त्याला आपल्या कंपनीच्या चिंधीचे मूल्यांकन करण्याची प्रक्रिया सुलभ करण्यासाठी वेक्टाराबरोबर भागीदारी करण्याची परवानगी दिली आहे.
हॅमलने लक्ष वेधले की त्याच्या चिंधीच्या स्केलिंगने पायाभूत सुविधांच्या जटिलतेबद्दल, पुनरावृत्तीची गती आणि उच्च खर्चाविषयी मोठी आव्हाने आणली आहेत.
“कामगिरी आणि अचूकतेच्या बाबतीत मानके आणि अपेक्षा जाणून घेणे आमच्या कार्यसंघाला आमच्या स्केलिंग खात्यांचा अंदाज लावण्यास मदत करते,” हॅमिल म्हणाले. “खरं सांगायचं तर, या वैशिष्ट्यांवर मानके निश्चित करण्यासाठी फारसे फ्रेमवर्क नव्हते; आम्ही वापरकर्त्याच्या नोटांवर जास्त अवलंबून आहोत, जे कधीकधी उद्दीष्ट होते आणि मोठ्या प्रमाणात यशामध्ये अनुवादित केले गेले.”
समानतेपासून सुधारणेपर्यंत: चिंधी गुन्हेगारांसाठी व्यावहारिक अनुप्रयोग
तांत्रिक निर्णय निर्मात्यांसाठी, ओपन रॅग इव्हल रॅग प्रकाशित करणे आणि तयार करण्याच्या निर्णायक प्रश्नांची उत्तरे देण्यास मदत करू शकते:
- आपण निश्चित किंवा अर्थपूर्ण नियंत्रण वापरू इच्छित असाल तर
- आपण संकर किंवा वेक्टर शोध वापरता की नाही आणि संकर शोधात लॅम्बडामध्ये वापरली जाणारी मूल्ये कोणती आहेत?
- कोणताही एलएलएम वापरण्यासाठी आणि कट दावे कसे सुधारित करावे
- भ्रम शोधण्यासाठी आणि दुरुस्त करण्यासाठी वापरण्याचे उंबरठा काय आहे
सराव मध्ये, संस्था सध्याच्या आरएजी सिस्टमसाठी मूलभूत पदवी तयार करू शकतात, लक्ष्यित रचनांमध्ये बदल करू शकतात आणि परिणामी सुधारणा मोजू शकतात. हा पुनरावृत्ती दृष्टिकोन डेटा -आधारित सुधारणांसह अंदाज लावत आहे.
ही प्रारंभिक आवृत्ती मोजमापावर केंद्रित असताना, रस्ता नकाशामध्ये सुधारणेची क्षमता समाविष्ट आहे जी मूल्यमापनाच्या निकालांच्या आधारे स्वयंचलितपणे प्रशिक्षण सुधारणे सुचवू शकते. भविष्यातील आवृत्त्या संस्थांना ऑपरेशनल खर्चासह कामगिरी दरम्यान संतुलन साधण्यात मदत करण्यासाठी खर्च मोजमाप देखील समाकलित करू शकतात.
कृत्रिम बुद्धिमत्ता स्वीकारण्यात नेतृत्वाची अपेक्षा असलेल्या संस्थांसाठी, ओपन रॅग इव्हल म्हणजे ते स्वत: चे मूल्यांकन किंवा विक्रेत्यांच्या दाव्यांवर अवलंबून राहण्याऐवजी मूल्यांकन करण्यासाठी वैज्ञानिक दृष्टिकोन अंमलात आणू शकतात. यापूर्वी कृत्रिम बुद्धिमत्ता प्रवासात, सुरुवातीपासूनच मूल्यांकनास सामोरे जाण्यासाठी ही एक संघटित पद्धत प्रदान करते आणि महागड्या चुका टाळू शकतात कारण ते त्यांची पायाभूत सुविधा तयार करतात.
Source link
















