उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


पुरुष विचारांचे मॉडेल-ते मजकूरात “आयडिया चेन” तयार करतात आणि वापरकर्त्यास प्रतिसाद देण्यापूर्वी रस्त्याच्या मध्यभागी त्रुटी निवडण्याचा प्रयत्न करण्यासाठी त्यांच्या स्वत: च्या विश्लेषणावर विचार करतात-या सर्वांना आता राग आला आहे. दीपसीक आणि ओपनई “मालिका.

तथापि, विचारांचे विचार मॉडेल कृत्रिम बुद्धिमत्ता उद्योगात पसरले आहे हे माझ्यासाठी आश्चर्यकारक आहे, यासह प्रयत्न करण्यासाठी आणखी एक नवीन मॉडेल आहे या आठवड्याची घोषणाहा एक रहस्यमय आणि प्रारंभिक नॉस रिसर्च संग्रह आहे, जो 2023 मध्ये न्यूयॉर्क शहरातील त्याच्या संपूर्ण प्रक्षेपणाचे संपूर्ण ध्येय आहे, लामा मेटा मालिका यासारख्या कृत्रिम बुद्धिमत्तेचे मॉडेल तयार करीत आहे आणि फ्रेंच मिस्त्रालच्या सुरूवातीपासून ?

https://www.youtube.com/watch?

हे देखील प्रकाशित केले गेले X वर संशोधन खाते कंपनीच्या डिसकॉर्डमध्ये, या नवीन मुक्त विचारांच्या मॉडेलला “डीपर्मेस -3” असे म्हणतात, “एलएलएम (एलएलएम) भाषा मॉडेल जे अंतर्ज्ञानी भाषेच्या मॉडेलच्या क्षमता एकत्रित करते” असे वर्णन केले जाते, वापरकर्त्याच्या इच्छेनुसार स्विच करण्याच्या क्षमतेसह वापरकर्त्याच्या क्षमतेच्या क्षमतेसह, दीर्घ विचार आणि प्रतिसाद सर्वात कमी, वेगवान आणि कमी खाते.

हे हर्मीस 3 मधील 8 अब्ज पॅरामीटर्स (सेटिंग्जची संख्या) चे बदल आहे आणि ऑगस्ट 2024 मध्ये नॉस बॅकने जारी केलेल्या लामा मेटाचे हे स्वतःच नमुन्यांच्या देवाणघेवाणीसह आहे जे हे दर्शविते की ते ज्ञानात समान ज्ञानात समाविष्ट केले जाऊ शकते. मानवी जागरूकताच्या तुलनेत स्वत: आणि कृत्रिम बुद्धिमत्तेच्या भूमिकेसाठी, एखाद्या गोष्टीची दिशा मॉडेलच्या आउटपुटमध्ये अस्तित्वातील संकटाकडे येते.

वापरकर्ते डाउनलोड करू शकतात लगिंगफेस वर संपूर्ण मॉडेल कोड आणि एक प्रत (कमी बिट) रक्कम आणि जतन केले जीपीटी (जीजीयूएफ) कडून युनिफाइड समन्वय)हे संगणक आणि ग्राहकांच्या पदवीवर मॉडेल अनुमान (वास्तविक उत्पादन इमारत, प्रशिक्षण ऐवजी) चालविण्यासाठी डिझाइन केलेले आहे.

आजच्या नॉस अकाउंटने लिहिले आहे की त्याच्या संशोधकांना “आशा आहे की वापरकर्त्याने नियंत्रित केलेल्या मोडकडे आमचा अनोखा दृष्टिकोन जो त्यांच्याकडे असलेल्या आवश्यकतेसाठी अधिक मार्गदर्शन वापरणार्‍या लोकांना देण्याचे आमचे ध्येय वाढवते.”

हर्मीस 3 वर आधारित: डेटा आणि प्रशिक्षण दृष्टीकोन

डीपर्हेम्स -3 हर्मीस 3 डेटा संकलनावर अवलंबून आहे, जे हर्मीस 3 मालिकेसाठी नॉस रिसर्चद्वारे प्रायोजित केलेले बहु-फील्ड डेटा संग्रह आहे.

त्यानुसार तांत्रिक अहवाल हर्मीस 3 हा डेटा संग्रह ऑगस्टमध्ये प्रसिद्ध झाला होता आणि यात शैक्षणिक क्षेत्र आणि विविध तर्कशास्त्रापर्यंत सुमारे 390 दशलक्ष प्रतीक आहेत.

डेटा सेट खालील मुख्य श्रेणींमध्ये विभागला गेला आहे:

सामान्य सूचना (60.6 %) -सामान्य हेतूंसाठी कृत्रिम बुद्धिमत्ता चॅट मॉडेल्सप्रमाणेच आणि मुक्त मागणी.

डोमेन तज्ञ डेटा (12.8 %) – विज्ञान, कायदा आणि अभियांत्रिकी यासारख्या क्षेत्रात विशेष ज्ञान.

गणित (6.7 %) प्रगत समस्या निराकरण डेटा गटांचे संख्यात्मक आणि तार्किक विचार सुधारण्याचे उद्दीष्ट आहे.

भूमिका आणि सर्जनशील लेखन प्ले करा (6.1 %) कथा आणि सिम्युलेशन संवादाचे कथन वाढविण्यासाठी डिझाइन केलेले डेटा.

कोडिंग आणि सॉफ्टवेअर डेव्हलपमेंट (4.5 %) कोड आणि त्रुटी सुधारण्याची कार्ये मिळवित आहेत.

पुनर्प्राप्ती (आरएजी) वर मात करण्यासाठी साधन, तोंडी तर्कशास्त्र आणि पिढीचा वापर (3.3 %) – नोकरीशी संपर्क साधण्याचे प्रशिक्षण, नियोजन आणि ज्ञान पुनर्संचयित करणे.

सामग्री निर्मिती (3.0 %) लेखन, सारांश आणि संघटित दिग्दर्शन कार्ये.

मार्गदर्शन आणि संरेखन (2.5 %) – डेटा मॉडेल बनवण्यावर लक्ष केंद्रित केला आणि वापरकर्त्याच्या मागण्यांना प्रतिसाद दिला.

याव्यतिरिक्त, नॉस नॉस (टेक्नियम)@teknium1 x वरकंपनी वापरकर्त्यास प्रतिसादाची पुस्तके डिसकॉर्ड सेवक हे प्रशिक्षण देण्यात आले की मॉडेलला “1 एम नॉन सीओटी आणि 150 के सीओटी” किंवा दहा लाख अभूतपूर्व आउटपुट आणि आयडियाज मालिकेच्या 150,000 आउटपुटवर प्रशिक्षण दिले गेले आहे.

हे डेटा मिश्रण अंतर्ज्ञानी प्रतिसाद आणि खोल संघटित विचारांदरम्यान स्विच करण्याची अद्वितीय डीपर्मेस -3 क्षमतेस समर्थन देते, हे एक प्रमुख वैशिष्ट्य आहे जे त्यास इतर एलएलएमपेक्षा वेगळे करते.

उपासना विचार मोड कसे कार्य करते

डीपहेर्म्स -3 वापरकर्त्यांना सिस्टमच्या राउटरचा वापर करून विचार करण्याच्या खोलीवर नियंत्रण ठेवण्याची परवानगी देते. फॉर्ममध्ये “स्विच टू” थिंकिंग मोडच्या आधी वापरकर्त्यास खालील मजकूर प्रविष्ट करणे आवश्यक आहे:

आपण कृत्रिम बुद्धिमत्ता खोल विचार करता, आपण उत्तरापूर्वी योग्य निराकरणात पोहोचण्यासाठी समस्येकडे लक्षपूर्वक पाहण्यासाठी आणि पद्धतशीर विचार प्रक्रियेद्वारे स्वत: ला सामोरे जाण्यासाठी विचार करण्याच्या खूप लांब साखळ्यांचा वापर करू शकता. आपण आपल्या कल्पना आणि अंतर्गत एकपात्री लक्षणांमध्ये संलग्न केले पाहिजेत, नंतर निराकरण प्रदान करा किंवा समस्येस प्रतिसाद द्या.

विचार मोड सक्षम करताना, मॉडेल लांब विचारांच्या साखळ्यांमधील माहितीवर प्रक्रिया करते, उत्तर तयार करण्यापूर्वी त्यास पद्धतशीरपणे प्रसारित करण्यास अनुमती देते.

हे वापरुन हे साध्य केले जाते चिन्हे, जेथे मॉडेलचे अंतर्गत एकपात्री अंतिम समाधान सादर करण्यापूर्वी नियमित केले जाते.

मानक प्रतिसाद मोडमध्ये, मॉडेल पारंपारिक एआय चॅटसारखे कार्य करते, खोल तार्किक उपचारांना वेगवान अंतर्ज्ञान -आधारित प्रतिसाद प्रदान करते.

परफॉरमन्स व्हिजन आणि समुदाय टिप्पण्या

प्रारंभिक निकष आणि समुदाय चाचण्यांनी सखोल क्षमतांमध्ये मूलभूत दृष्टिकोन प्रदान केले 3:

क्रीडा विचार: डिस्टिल्ड डीपसेक आर 1 मॉडेलच्या 89.1 % च्या तुलनेत गणिताच्या मानकांवर डीप डेविल्स 3 67 %. शुद्ध गणिताच्या कार्यात दीपसीक हे मागे टाकत असताना, संशोधन नॉस विस्तृत संभाषण कौशल्ये आणि विचारसरणीसह अधिक सामान्य मॉडेल म्हणून खोलीत आहे.

एकाधिक वळण संभाषणे: काही प्रयोगशाळांनी माहिती दिली की विचारांची परिस्थिती पहिल्या प्रतिसादावर योग्यरित्या सक्रिय आहे, परंतु ती विस्तारित संभाषणे सुरू ठेवण्यात अयशस्वी होऊ शकते. सोसायटीचे सदस्य अंमलबजावणी सुचवतात Respond n प्रत्येक प्रतिसादाच्या सुरूवातीस, डीपसीक-आर 1 मध्ये देखील वापरला जातो.

आमंत्रण एक काम आहेडीपहेर्म्स -3 साधनाच्या वापरास समर्थन देते, जरी हे विचार मोड आणि नोकरी कनेक्शन एकाच वेळी समाकलित करण्यासाठी स्पष्टपणे प्रशिक्षण दिले गेले नाही. काही वापरकर्त्यांनी नोंदवले आहे की दोन वैशिष्ट्यांचे संयोजन साधनांच्या अंमलबजावणीत अचूकता सुधारते, परंतु परिणाम विसंगत राहतात.

नॉस रिसर्च विचार स्थिरता सुधारण्यासाठी आणि एकाधिक वळण प्रतिक्रिया सुधारण्यासाठी वापरकर्ता नोट्स सक्रियपणे संकलित करते.

डिव्हाइसचे प्रकाशन आणि कार्यप्रदर्शन

डीपर्मेस -3 आलिंगन चाचणीसाठी उपलब्ध आहे, कारण जीजीयूएफ क्वांटिटेटिव्ह्ज कमी-उर्जा उपकरणांसाठी सुधारित आहेत. मॉडेल निकृष्टतेसाठी व्हीएलएलएमशी सुसंगत आहे आणि बहु-टर्नसाठी लामा-कॅट स्वरूप वापरते.

वापरकर्त्यांपैकी एकाने मॅकबुक प्रो एम 4 मॅक्सवर प्रति सेकंद 28.98 चिन्हांच्या प्रक्रियेची गती नोंदविली आहे, हे दर्शविते की मॉडेल ग्राहक उपकरणांवर कार्यक्षमतेने कार्य करू शकते.

डीपर्मेस -3 लामा 3 मेटा मॉडेलवर अवलंबून आहे आणि मेटा लामा 3 कम्युनिटी लायसन्सद्वारे शासित आहे, तर मॉडेल वापर, सुधारणे आणि पुनर्वितरणासाठी विनामूल्य उपलब्ध आहे, काही अटी लागू आहेत:

पुनर्वितरण: कोणतीही व्युत्पन्न मॉडेल किंवा मूळ परवाना देणारी प्रकाशनांमध्ये “मेटा लामा 3 सह डिझाइन केलेले” मुख्यतः प्रदर्शित करणे आवश्यक आहे आणि प्रदर्शित करणे आवश्यक आहे.

ठराविक प्रशिक्षणातील सेटिंग्ज: लामा 3 वरील स्पष्ट व्युत्पन्न कामांचा अपवाद वगळता वापरकर्ते इतर मोठ्या भाषेच्या मॉडेल्सना प्रशिक्षण देण्यासाठी डीपहेर्म्स -3 (किंवा लामा 3) वापरू शकत नाहीत.

• सीमोठ्या कंपन्यांसाठी ओमर्सियल परवाना: दरमहा 700 दशलक्षाहून अधिक सक्रिय वापरकर्त्यांचा समावेश असलेल्या संस्थांना मॉडेल व्यावसायिकरित्या वापरण्यापूर्वी मेटा कडून स्पष्ट मान्यता असणे आवश्यक आहे.

Use स्वीकार्य वापर धोरण: वापरकर्त्यांनी एआय मेटाच्या निर्बंधांचे पालन केले पाहिजे, जे चुकीची माहिती, देखरेख करणे आणि हानिकारक सामग्री तयार करणे यासारख्या क्षेत्रातील अनुप्रयोगांना प्रतिबंधित करते.

हे पुन्हा वितरण नियम आणि व्यावसायिक निर्बंधांचा अर्थ असा आहे की पारंपारिक अर्थाने डीपहेर्म्स -3 पूर्णपणे खुले नाही, जरी ते एबीसीच्या तोंडावर उपलब्ध आहे, स्पर्धा मॉडेल आर 1 चीनी स्पर्धेच्या विपरीत, जे उपलब्ध आहे आणि उपलब्ध आहे मॅसेच्युसेट्स इन्स्टिट्यूट ऑफ टेक्नॉलॉजी परवान्याअंतर्गत?

आम्ही हर्मीस 4 ची अपेक्षा करतो

डीपर्मेस -3 टेक्निअम, इमोझिला, @गम्मेड गमी बी, @एचजेसी-पुरो आणि जेसुफ यांनी विकसित केले होते, ज्यात डेटा सेट्स, मूल्यांकन आणि विशिष्ट प्रशिक्षण साधनांच्या योगदानाच्या मुक्त स्त्रोताचे श्रेय दिले जाते.

नॉस रिसर्चचा असा विश्वास आहे की हे पूर्वावलोकन मॉडेल एक चरण आहे -स्टेप स्टोन, हर्मीस 4, जे त्याचे विचार आणि संभाषण सुधारेल अशी अपेक्षा आहे.


Source link