उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
तृतीय-पक्षाच्या ट्रॅकिंग विषयानुसार मिडजॉर्नी एआयच्या आघाडीच्या 20 दशलक्ष वापरकर्त्यांसह एक आघाडीच्या एआयच्या फोटो जनरेटर म्हणून प्रसिद्ध आहे आणि ती वेबसाइटवर असावी असे मानले जाते परंतु त्याच्या महत्वाकांक्षा वाढू लागल्या आहेत.
२०२24 च्या उन्हाळ्याच्या उत्तरार्धातील बातम्यांच्या पार्श्वभूमीवर, ते आपले संगणकीय उपकरणे आणि कृत्रिम बुद्धिमत्ता उपकरणे तयार करीत होते, या आठवड्यात कंपनीने न्यूयॉर्क युनिव्हर्सिटी (एनवाययू) मधील स्वयंचलित शिक्षण तज्ञांसह एक नवीन संशोधन पेपर जारी केला जसे की मेटा ओपन सोर्स लामा आणि मिस्टरल बहुतेक सर्जनशीलता.
कोड कोड कम्युनिटी फेसवर प्रकाशित केलेल्या नवीन संशोधन पेपरमध्ये दस्तऐवजीकरण केलेल्या सहकार्याने दोन नवीन तंत्रज्ञानाची ओळख करुन दिली आहे – विविध थेट पसंती (डीडीपीओ) सुधारित करणे आणि विविध प्राधान्ये सुधारणे (डीओआरपीओ) – एकत्रीकरण आणि वाचन क्षमता राखताना संभाव्य आउटपुट वाढविण्यासाठी डिझाइन केलेले.
एआयच्या पिढीच्या मॉडेल्ससाठी प्रसिद्ध असलेल्या कंपनीसाठी, मजकूर -आधारित एलएलएमएसमध्ये सर्जनशीलताबद्दल पुन्हा विचार करण्याचा नवीन मिडजॉर्नी दृष्टीकोन दर्शवितो की तो प्रतिमांमध्ये त्याच्या महत्वाकांक्षा मर्यादित करत नाही आणि प्रतिमा प्रत्यक्षात हजार शब्दांच्या समान असू शकते.
एलएलएम मिडजॉर्नी नेटिव्ह किंवा स्टार्ट -अपपासून बूट पर्यंत प्रारंभ करण्यापासून कार्डमधील एलएलएमची एक कठीण आवृत्ती असू शकते? मी मिडजॉर्नी डेव्हिड होल्झच्या संस्थापक येथे पोहोचलो, परंतु मी अद्याप ऐकले नाही.
पहिल्या शेवटी मिडजॉर्नी एलएलएम रुंदीची पर्वा न करता, त्याच्या नवीन संशोधनाचा परिणाम शैक्षणिक व्यायामाच्या पलीकडे जातो आणि कृत्रिम बुद्धिमत्तेत तयार केलेला मजकूर सुधारित करण्याच्या प्रयत्नात असलेल्या संस्था, उत्पादन विकसक आणि सामग्री निर्माते यांच्यात एलएलएम प्रशिक्षणातील नवीन लाट वाढविण्यासाठी वापरला जाऊ शकतो.
ते असेही स्पष्ट करतात की नवीन मल्टीमीडिया आणि लॉजिकच्या मॉडेल्समध्ये अॅम्नेस्टी इंटरनॅशनलच्या मॉडेल्सच्या सेवा प्रदात्यांमधील आधुनिक स्वारस्य आणि गुंतवणूक असूनही, मजकूरावर लक्ष केंद्रित करणार्या क्लासिक एलएलएमकडून उर्वरित रस दबाव, संज्ञानात्मक आणि कार्यक्षमता आहे.
समस्या: कृत्रिम बुद्धिमत्तेपासून तयार केलेले लेखन एकसंध आउटपुट बद्दल कोसळते
फॅक्ट -सारख्या फील्डमध्ये -क्यूटिंग क्यू अँड ए किंवा कोडिंगमध्ये मदत, एलएलएमने सर्वोत्तम प्रतिसाद तयार करणे अपेक्षित आहे.
तथापि, सर्जनशील लेखन निसर्गाने खुले आहे, याचा अर्थ असा आहे की मागणीसाठी अनेक योग्य प्रतिसाद आहेत.
मिडजॉर्नीच्या संशोधकांनी केलेल्या उदाहरणासाठी, त्यांनी दावा सारखा दिला “चंद्रावरील कुत्र्याबद्दल एक कथा लिहा”एलएलएम अनेक विविध ट्रॅक एक्सप्लोर करू शकते जसे:
- चंद्राच्या ध्येयानंतर त्याने एका अंतराळवीरात पाळीव प्राणी कुत्रा सोडला.
- भविष्यातील कुत्र्यांच्या वसाहतीत कुत्रा स्वतःला शोधतो.
- एक मार्ग असलेला कुत्रा एक विचित्र प्रकार मैत्री करतो.
या शक्यतांच्या श्रेणी असूनही, सूचनांमध्ये जप्त केलेले एलएलएम अनेकदा समान रेषा आणि विषयांवर एकत्रित केले जातात. हे घडते कारण:
- पोस्ट -ट्रेडिंग तंत्रज्ञान वापरकर्त्याची पसंती मौलिकतेपेक्षा देते, जे लोकप्रिय परंतु वारंवार प्रतिसाद वाढवते.
- सूचनांचे समायोजन बर्याचदा कॉन्ट्रास्ट होते, जे मॉडेल अद्वितीय प्रतिसादांपेक्षा “सुरक्षित” प्रतिसादांना प्राधान्य देतात.
- मॉडेल शिकण्याच्या प्रक्रियेत ब्रेडऐवजी सध्याची विविधता वर्धित तंत्र (जसे की तापमान नियंत्रण) तर्क करण्याच्या वेळी कार्य करते.
कृत्रिम बुद्धिमत्तेपासून तयार केलेल्या सर्जनशील लेखनाची पुनरावृत्ती जाणवते आणि आश्चर्यचकित किंवा खोलीचा अभाव असल्याने हे एकसंध कथा ठरते.
समाधानः विविधतेची प्राथमिकता निश्चित करण्यासाठी पोस्ट -ट्रेडिंग पद्धती सुधारित करणे
या निर्बंधांवर मात करण्यासाठी, डीडीपीओ आणि डोर्पो यांनी सध्याच्या प्राधान्यांसाठी दोन विस्तार सादर केले. या पद्धतींमध्ये मूलभूत नावीन्य म्हणजे विचलनाचा वापर – थेट प्रशिक्षणासाठी इतरांचा प्रतिसाद किती वेगळा आहे याचा एक उपाय.
कसे कार्य करावे ते येथे आहे:
- प्रशिक्षणादरम्यान, मॉडेलला तडजोड आणि संभाव्य एकाधिक प्रतिसाद दिले जातात.
- इतरांना प्रत्येक प्रतिसादाची तुलना त्याच दाव्याशी केली जाते आणि विचलनाची डिग्री मोजली जाते.
- दुर्मिळ परंतु उच्च -गुणवत्तेच्या प्रतिक्रियेचे प्रशिक्षण प्रशिक्षणात अत्यंत वजन आहे आणि मॉडेलला विविध उदाहरणांमधून शिकण्यास प्रोत्साहित केले जाते.
थेट पसंती (डीपीओ) सुधारण्यासाठी आणि प्राधान्ये सुधारित करून (ओआरपीओ) विचलन समाकलित करून, मॉडेल उच्च -गुणवत्तेचे परंतु अधिक भिन्न प्रतिसाद तयार करण्यास शिकते.
ही पद्धत हमी देते की कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या कहाण्या एकाच भविष्यवाणीच्या संरचनेसह एकत्रित होत नाहीत, परंतु त्याऐवजी मानवी लेखक म्हणून विस्तृत वर्ण, सेटिंग्ज आणि विषयांची विस्तृत श्रेणी एक्सप्लोर करा.
हे साध्य करण्यासाठी मिडजॉर्नीमधील संशोधकांनी काय केले
अभ्यासामध्ये सर्जन्ट आर/ट्रिंट्सप्रॉम्प्ट्स, रेडिट समुदायातील डेटाचा संच वापरून सर्जनशील लेखन कार्यांवरील एलएलएमएस प्रशिक्षण समाविष्ट आहे, जेथे वापरकर्ते दावे प्रकाशित करतात आणि लघुकथांसह प्रतिसाद देतात.
त्यांना प्रशिक्षण देण्यासाठी संशोधकांनी दोन मूलभूत मॉडेल्स वापरली:
- मेटाचा लामा -3.1-8 बी ((मॉडेल 8 अब्ज लामा 3 मालिका).
- मिस्त्राल -7 बी-व्ही 0.3 ((मिस्त्राल एआय कडून 7 अब्ज शिक्षकांचे स्वरूप).
मग त्यांनी खालील ऑपरेशन्सद्वारे ही मॉडेल्स घेतली:
- सेवा पर्यवेक्षणाच्या अधीन आहे (एसएफटी): कार्यक्षमतेने पॅरामीटर्स समायोजित करण्यासाठी मॉडेल प्रथम एलओआरए (लो -रँकिंग अॅडॉप्टेशन) वापरुन समायोजित केले गेले.
- प्राधान्य सुधारणे:
- डीपीओ आणि ओआरपीओ फाउंडेशन लाईन्स म्हणून वापरले गेले आहेत– या मानक पद्धती वापरकर्त्याच्या पसंतीच्या सिग्नलवर आधारित प्रतिसाद गुणवत्ता सुधारण्यावर लक्ष केंद्रित करतात.
- मग डीडीपीओ आणि डोर्पो लागू केलेअधिक अद्वितीय प्रतिसादांना प्रोत्साहित करण्यासाठी पेनल्टी शूटआउट प्रदान करणे.
- मूल्यांकन:
- स्वयंचलित मूल्यांकन: सिमेंटिक विविधता आणि समावेश -आधारित तंत्राचा वापर करून मोजले जाते.
- मानवी मूल्यांकनः जीपीटी -4 ओ आणि क्लॉड 3.5 च्या तुलनेत आउटपुट भिन्न आणि सामायिक केले गेले की नाही हे न्यायाधीशांनी मूल्यांकन केले.
मुख्य प्रशिक्षण परिणामः
- डीडीपीओने मानक डीपीओला मोठ्या प्रमाणात कामगिरी केली गुणवत्ता राखताना दिग्दर्शित करण्याच्या विविधतेच्या बाबतीत.
- लामा -3.1-8 बीने सर्वोत्कृष्ट शिल्लक प्राप्त केली आहे गुणवत्ता, विविधता आणि प्रतिसादांचे उत्पादन अधिक वैविध्यपूर्ण जीपीटी -4 ओ एकरूपता राखत असताना.
- जेव्हा डेटा सेटचा आकार कमी झालाडीडीपीओ मॉडेल्स अद्याप विविधता राखतात, जरी त्यांना संपूर्णपणे प्रभावी होण्यासाठी विविध प्रशिक्षण नमुने आवश्यक आहेत.
संस्थांचे परिणामः सर्जनशील प्रतिसाद तयार करण्यासाठी कृत्रिम बुद्धिमत्ता वापरणा those ्यांसाठी याचा अर्थ काय आहे – विपणन ग्रंथ, कंपन्यांचे कथाकथन, मजकूर प्रोग्रामिंग/टेलिव्हिजन/व्हिडिओमध्ये असे आहे?
कृत्रिम बुद्धिमत्ता कार्यसंघ जे एलएलएमच्या तैनातीचे व्यवस्थापन करतात, गुणवत्ता राखताना दिग्दर्शनाची विविधता वाढविणे हे एक महत्त्वाचे आव्हान आहे. या परिणामांचे अनुप्रयोगांमध्ये कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या सामग्रीवर अवलंबून असलेल्या संस्थांवर महत्त्वपूर्ण परिणाम आहेत:
- कृत्रिम बुद्धिमत्ता संभाषण आणि चॅटबॉट्स (विविध आणि आकर्षक प्रतिसाद सुनिश्चित करणे).
- सामग्री विपणन साधने आणि कथाकथन (कृत्रिम बुद्धिमत्तेची वारंवार प्रत रोखत आहे).
- खेळ विकास आणि कथन डिझाइन (एक वैविध्यपूर्ण संवाद आणि शाखा कथा तयार करा).
संस्था तयार करण्यासाठी मॉडेल परिष्कृत आणि प्रकाशित करण्यासाठी जबाबदार व्यावसायिकांसाठी, हे संशोधन प्रदान करते:
- प्रशिक्षणानंतर एलएलएमकडे एक नवीन दृष्टीकोन गुणवत्तेचा बळी न देता सर्जनशीलता वाढवते.
- शिक्षण प्रक्रियेतच विविधता एकत्रित करून तर्कशक्तीच्या वेळेची विविधता (जसे की तापमान समायोजन) नियंत्रित करण्याचा एक व्यावहारिक पर्याय.
- कृत्रिम बुद्धिमत्तेचे अधिक आकर्षक अनुप्रयोग विकसित करण्याची क्षमता, एआयच्या मदतीने साधने लिहिण्यापासून ते आभासी सहाय्यकांपर्यंत जे त्यांचे गतिशील प्रतिसाद अनुकूल करू शकतात.
जे कृत्रिम बुद्धिमत्ता मॉडेल आणि ऑटोमेशनच्या स्वरूपाचा सामना करतात त्यांच्यासाठी हे संशोधन अधोरेखित केले गेले आहे:
- प्रशिक्षण टप्प्यात जप्ती मॉडेलचे महत्त्व, जे प्रकाशनानंतर पोस्ट -ट्रीटमेंट बदलांची आवश्यकता कमी करते.
- उच्च सामग्रीची गुणवत्ता राखताना कॉन्ट्रास्ट सुनिश्चित करणे, एआय-ड्राइव्ह एआय अनुप्रयोगांमध्ये अनुकूली कथा कादंबरी सादर करण्याचा एक मार्ग.
- एलएलएमला अधिक मानवी -सारखे आउटपुट बनविण्याचा एक मार्ग, जो परस्पर कथा, ग्राहक सामायिकरण किंवा डायनॅमिक सामग्री निर्मिती आवश्यक असलेल्या अनुप्रयोगांसाठी महत्त्वपूर्ण आहे.
कृत्रिम बुद्धिमत्तेद्वारे व्युत्पन्न केलेल्या सर्जनशील प्रकल्पांचे भविष्य उज्ज्वल दिसते
डीडीपीओ आणि डोर्पो यांचे यश स्पष्ट करते की विविधता -केंद्रित लक्ष्यांसह एलएलएमएस प्रशिक्षणामुळे सर्जनशील लेखनात महत्त्वपूर्ण सुधारणा होऊ शकते. काही कल्पनांमध्ये हे समाविष्ट आहे:
- फाउंडेशनसाठी अॅम्नेस्टी इंटरनॅशनलच्या मॉडेल्समध्ये विचलन -आधारित शिक्षण विलीन करणे ग्राहकांना सामोरे जाणा applications ्या अनुप्रयोगांमध्ये प्रतिसादाची विविधता वाढविण्यासाठी.
- या पद्धती इतर प्रसूती कार्यांवर कशा लागू केल्या जातात ते एक्सप्लोर कराकृत्रिम बुद्धिमत्ता, स्क्रिप्ट लेखन किंवा कथा सांगणारी कविता यासारखे.
- संकरित प्रशिक्षण पध्दतीचा विकास हे शिल्लक विविध क्षमता आणि सूचनांचा पाठपुरावा कृत्रिम बुद्धिमत्ता सहाय्यकांसाठी.
या तंत्रज्ञानाचा उपयोग करू इच्छिणा .्यांसाठी, संशोधक या गीथब वेअरहाऊसवर लोकांचे प्रतीक देण्याची योजना आखत आहेत
आपण व्यवसाय अनुप्रयोगांसाठी एलएलएमएस स्थापित करीत असलात किंवा मोठ्या प्रमाणात कृत्रिम बुद्धिमत्ता समन्वय सुधारत असलात तरी, हा अभ्यास मॉडेल अधिक गतिमान, आकर्षक आणि सर्जनशील कार्यांना कसे प्रतिसाद देतात यावर अंमलबजावणीची दृष्टी प्रदान करते.
या तंत्रज्ञानाचा अवलंब करून, कृत्रिम बुद्धिमत्ता फरक घन घन आउटपुटपेक्षा जास्त असू शकतो – कृत्रिम बुद्धिमत्ता प्रणाली तयार करणे जे केवळ स्मार्टच नाही तर खरोखर काल्पनिक देखील आहे.
Source link