उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
सॅन फ्रान्सिस्कोमध्ये नवीन कृत्रिम बुद्धिमत्ता संशोधन सुरू करणारे डीप कोगीटो अधिकृतपणे आज स्टिल्थमधून कोगीटोसह दिसले व्ही 1, मोठ्या ओपन सोर्स लँग्वेज मॉडेल्सची एक नवीन ओळ (एलएलएमएस) जी लामाच्या लामाच्या मेटामधून जप्त केली गेली आणि हायब्रीड विचारांच्या क्षमतेसह सुसज्ज आहे-द्रुत आणि त्वरित उत्तर देण्याची क्षमता, किंवा “ओ ओपनई आणि दीपसेक आर 1 मालिका” सारख्या “प्रतिबिंबित”.
सुधारित विचारांची रणनीती वारंवार सुधारित आणि आत्मसात करण्यासाठी मॉडेल सक्षम करून सध्याच्या व्यक्तीच्या निर्बंधांपर्यंत कृत्रिम बुद्धिमत्तेची मर्यादा ढकलणे या कंपनीचे उद्दीष्ट आहे. हे शेवटी उत्कृष्ट रद्दबातल प्रक्रियेच्या विकासाच्या शोधात – एआय सर्व क्षेत्रातील सर्व लोकांपेक्षा अधिक बुद्धिमान आहे – तथापि कंपनी म्हणतो की “आम्ही तयार केलेले सर्व मॉडेल स्त्रोतांकडून खुले असतील.”
दीप कोगीटो, द्रिशान अरुरा-माजी गुगल सॉफ्टवेअर अभियंते ज्यांचे म्हणणे आहे की त्यांनी एक्स वरील गूगलच्या प्रसूतिशास्त्र संशोधन निर्मात्याच्या ग्रेट लँग्वेज मॉडेल (एलएलएम) चे नेतृत्व केले, ते म्हणाले की, “लामा, दीपसी आणि क्वेनमधील मोठ्या प्रमाणात समावेश असलेल्या मोठ्या प्रमाणावर असलेले हे सर्वात शक्तिशाली खुले मॉडेल आहेत.”
प्रारंभिक मॉडेलच्या वर्गीकरणात पाच मूलभूत आकारांचा समावेश आहे: billion अब्ज, billion अब्ज, १ billion अब्ज, billion२ अब्ज आणि billion० अब्ज शिक्षक, आता कोड कोड कम्युनिटी वेस आणि ओलामा आणि फटाक्यांवरील एपीआय प्रोग्रामिंग फासडेस (एपीआय) च्या माध्यमातून फटाके आणि एआय कलेक्शनवर.
हे लामा परवाना देण्याच्या अटींनुसार उपलब्ध आहे जे व्यावसायिक वापरास अनुमती देते की तृतीय-पक्ष संस्था त्यांना दरमहा 700 दशलक्ष वापरकर्त्यांपर्यंत देय उत्पादनांमध्ये ठेवू शकतात आणि नंतर त्यांना मेटामधून सशुल्क परवाना मिळवणे आवश्यक आहे.
येत्या काही महिन्यांत कंपनीची मोठी मॉडेल्स – 1 67१ अब्ज शिक्षक – जारी करण्याची योजना आहे.
अरोरा कंपनीचा प्रशिक्षण दृष्टिकोन, वारंवार डिस्टिलेशन आणि एम्प्लिफिकेशन (आयडीए) चे वर्णन करते, मानवी टिप्पण्या (आरएलएचएफ) च्या पारंपारिक मजबुतीकरण (आरएलएचएफ) शिकण्यासाठी किंवा शिक्षकांच्या मॉडेलला विकृत करण्यासाठी एक नवीन पर्याय म्हणून.
सुधारित उपाय तयार करण्यासाठी अधिक मॉडेल खाते सानुकूलित करणे, नंतर मॉडेलच्या पॅरामीटर्समध्ये सुधारित विचार प्रक्रियेचे लक्ष विचलित करणे – क्षमता वाढीसाठी प्रभावी प्रतिक्रिया लूपची निर्मिती करणे ही आयडीएमागील मुख्य कल्पना आहे. अरोरा नैसर्गिक भाषेवर लागू असलेल्या सेल्फ -गेमसाठी Google अल्फागो स्ट्रॅटेजीच्या या दृष्टिकोनाप्रमाणेच आहे.
ओपन सोर्स कोगीटो मॉडेल्स हगिंग फेस आणि ओलामाद्वारे डाउनलोड करण्यासाठी किंवा एआय आणि टॉवर एआय द्वारे प्रदान केलेल्या अनुप्रयोग प्रोग्रामिंगच्या दर्शनी भागाद्वारे उपलब्ध आहेत. प्रत्येक मॉडेल थेट उत्तरे आणि विचारांच्या मानक स्थितीचे समर्थन करते, कारण प्रतिसादापूर्वी मॉडेल अंतर्गत प्रतिबिंबित होते.
मानके आणि मूल्यांकन
कंपनीने सार्वजनिक ज्ञान, क्रीडा विचार आणि बहु -भाषेच्या कार्यांद्वारे कोगीटो मॉडेल्सची त्याच्या मुक्त स्त्रोत समवयस्कांशी तुलना केली. प्रमुख मुद्द्यांमध्ये हे समाविष्ट आहे:
- कोगीटो 3 बी (मानक) हे उत्कृष्ट आहे लामा 3.2 3 बी एमएमएलयू वर 6.7 सेल्सिअस (58.7 % च्या तुलनेत 65.4 %) आणि हेलासवागवर 18.8 गुणांसह (81.1 % 62.3 % च्या तुलनेत).
- मध्ये विचारआणि कोगीटो 3 बी ग्रेड एमएमएलयूवर 72.6 % आणि कमानीवर 84.2 % आहेत, जे त्यांच्या स्वत: च्या मानक कामगिरीपेक्षा जास्त आहेत आणि आयडीए सेल्फ -रिफ्लेक्शन प्रभाव दर्शवित आहेत.
- कोगीटो 8 बी (मानक) 80.5 % एमएमएलयूवर रेकॉर्ड केले गेले आहे, उत्कृष्ट कामगिरी कॉल 3.1 बी. 12.8 गुणांनी. यामुळे एमएमएलयू-प्रो वर 11 पेक्षा जास्त गुण मिळतात आणि कमानीवर 88.7 % प्राप्त होते.
- मध्ये विचारआणि कोगीटो 8 बी हे एमएमएलयूने 83.1 % आणि धनुष्यावर 92.0 % प्राप्त करते. ते ओलांडते दीपसीक आर 1 डिस्टिल 8 बी गणिताच्या मानक वगळता जवळजवळ प्रत्येक श्रेणीमध्ये, कोगीटो खूपच कमी नोंदवते (.6०..6 % च्या तुलनेत .2०.२ %).
- कोगीटो 14 बी आणि 32 बी मॉडेल्स एक्सेल Qwen2.5 एकूण मानकांवर सुमारे 2-3 टक्के गुणांचे अबसन कोगीटो 32 बी (विचार) हे एमएमएलयूवर 90.2 % आणि गणिताच्या मानकांवर 91.8 % पर्यंत पोहोचते.
- कोगीटो 70 बी (मानक) हे उत्कृष्ट आहे 3.3 70 बी कॉल करा एमएमएलयू वर 6.4 गुणांनी (85.3 % च्या तुलनेत 91.7 %) आणि त्यापेक्षा जास्त आहे लामा 4 स्काऊट 109 बी एकूण मानक ग्रेडवर (53.3 % च्या तुलनेत 54.5 %).
- विरुद्ध दीपसीक आर 1 डिस्टिल 70 बीआणि कोगीटो 70 बी (विचार) सहभागी सामान्य आणि बहु -भाषेच्या मानकांमध्ये मजबूत परिणाम आहेत, एमएमएलयूवर .0 १.० % आणि एमजीएसएमवर .7 २..7 %.
कोगीटोची मॉडेल्स सामान्यत: तिची विचारसरणी मोडमध्ये तिची सर्वोच्च कामगिरी दर्शवितात, जरी काही भिन्नता विशेषत: गणितामध्ये दिसतात.
उदाहरणार्थ, कोगीटो 70 बी (मानक) किंवा गणित आणि जीएसएम 8 के मधील त्यांच्या समवयस्कांपेक्षा किंचित ओलांडत असताना, कॉगीटो 70 बी (विचारसरणी) डीप्सेक आर 1 मार्ग गणितामध्ये पाच टक्क्यांपेक्षा जास्त गुण (89.0 % च्या तुलनेत 83.3 %) आहेत.
कॉर्पोरेशन कॉलिंग टूल
सामान्य मानकांव्यतिरिक्त, डीप कोगीटोने एपीआय इंटिग्रेटेड एजंट्स आणि सिस्टमसाठी मूळ साधनांच्या कार्यक्षमतेवर आपल्या मॉडेलचे मूल्यांकन केले आहे.
- कोगीटो 3 बी चार मूळ साधन पदनामांना (साधे, समांतर, एकाधिक आणि समांतर) समर्थन देते, तर लामा 3.2 3 बी टूल कनेक्शनला समर्थन देऊ नका.
- साध्या टूल कॉलवर कोगीटो 3 बी 92.8 % आणि एकाधिक टूल कॉलवर 91 % पेक्षा जास्त.
- सर्व प्रकारच्या टूल कॉलमध्ये कोगीटो 8 बी 89 % पेक्षा जास्त आहे, कार्यक्षमतेला मोठ्या प्रमाणात आउटफॉर्मफॉर्म करते कॉल 3.1 बी.जे 35 % ते 54 % दरम्यान आहे.
या सुधारणांचे श्रेय केवळ आर्किटेक्चर आणि प्रशिक्षण डेटाच्या डिझाइनचेच नाही तर टास्क ट्रेनिंगला देखील दिले जाते, जे सध्या बर्याच मूलभूत मॉडेल्सची कमतरता आहे.
आम्ही पुढे पाहतो
डीप कोगीटो येत्या काही महिन्यांत मोठ्या -स्केल मॉडेल जारी करण्याची योजना आखत आहे, ज्यात 109 बी, 400 बी आणि 671 बी मधील अनुभवाचे बनावट व्हेरिएबल्स आहेत. कंपनी विस्तारित प्रशिक्षणासह वर्तमान मॉडेल चेकपॉईंट्स अद्यतनित करणे सुरू ठेवेल.
कंपनी विकासात्मक स्वत: ची सुधारणा करण्याच्या दिशेने दीर्घकालीन मार्ग म्हणून आयडीए कार्यपद्धती ठेवते आणि मानवी किंवा निश्चित शिक्षकांच्या मॉडेल्सवर अवलंबून राहते.
अरोराने यावर जोर दिला आहे की कामगिरीचे मानक महत्त्वाचे असले तरी वास्तविक जगाचा फायदा आणि परिस्थितीशी जुळवून घेण्याची क्षमता ही या मॉडेल्सच्या वास्तविक चाचण्या आहेत आणि कंपनी आपल्याला वाटते की ती एक तीव्र वक्र आहे.
डीप कोगीटोच्या संशोधन आणि पायाभूत सुविधांच्या भागीदारीमध्ये मिठी मारणे, रनपॉड, फटाके एआय, टोगॉन्ट एआय आणि ओलामा या संघाचा समावेश आहे. सर्व मॉडेल्स रिलीज रिलीज आणि आता उपलब्ध आहेत.
Source link