उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
अबाबा मधील चिनी ई -कॉमर्स आणि क्लाऊड ग्राहक युनायटेड स्टेट्स आणि परदेशातील इतर कृत्रिम बुद्धिमत्ता मॉडेल्सचे दबाव हस्तांतरित करीत नाहीत.
नवीन QWEN3 कुटूंबाच्या प्रक्षेपणानंतर काही दिवसांनंतर, जे नवीनतम स्त्रोतांवर दर्शविले गेले होते, अलिबाबा येथे क्यूवेन टीम टुडे क्वेन 2.5-यूएमआय -3 बी आहे, मागील मल्टीमीडियाच्या मॉडेलची एक प्रकाश आवृत्ती, मजकूर, ध्वनी, इंटरसेक्शन आणि व्हिडिओ इनपुटद्वारे विस्तृत कार्ये न करता ग्राहक उपकरणांवर प्ले करण्यासाठी डिझाइन केलेले आहे.
QWEN2.5-OMNI-3B एक आरक्षित व्हेरिएबल आहे, अग्रगण्य पॅरामीटर मॉडेल 7 अब्ज (7 बी) चे 3 अब्ज पॅरामीटर्स. (समनॅरी पॅरामीटर्स अधिक शक्तिशाली आणि जटिल मॉडेल्ससह मॉडेलच्या वर्तन आणि कार्ये नियंत्रित करणार्या सेटिंग्जची संख्या दर्शवितात).
जरी लहान आकारात, 3 बी आवृत्ती मोठ्या मॉडेलच्या मल्टीमीडिया कामगिरीच्या 90 % पेक्षा जास्त राखून ठेवते आणि मजकूर आणि नैसर्गिक भाषणात वास्तविक वेळ पिढी प्रदान करते.
जीपीयूच्या कार्यक्षमतेत महत्त्वपूर्ण सुधारणा येते. टीम नमूद करते की क्वेन 2.5-यूएमआय -3 बी 25,000 प्रतीकांच्या लांब संदर्भ इनपुटवर प्रक्रिया करताना व्हीआरएएमचा वापर 50 % पेक्षा कमी करते. सुधारित सेटिंग्जसह, मेमरीचा वापर 60.2 जीबी (7 बी) वरून केवळ 28.2 जीबी (3 बी मॉडेल) पर्यंत कमी होतो, जो 24 जीबी ग्राफिक्स प्रोसेसिंग युनिट्सवर सामान्यत: उच्च-एंड डेस्कटॉप आणि लॅपटॉप-इनस्टेडमध्ये प्रकाशनास अनुमती देतो.
विकसकांच्या मते, हे विचारवंत-पुनरावृत्ती डिझाइन करणे आणि समर्पित स्थिती, टीएमआरप समाविष्ट करण्याचा मार्ग यासारख्या आर्किटेक्चरल वैशिष्ट्यांद्वारे हे साध्य करते जे एकाचवेळी समजून घेण्यासाठी व्हिडिओ आणि ध्वनी इनपुटशी संबंधित आहे.
तथापि, परवाना देण्याच्या अटी केवळ निर्धारित केल्या जातात – याचा अर्थ असा की अलिबाबा येथील क्वेन टीमकडून स्वतंत्र परवाना मिळाल्याशिवाय संस्था व्यावसायिक उत्पादने तयार करण्यासाठी मॉडेलचा वापर करू शकत नाहीत.
या घोषणेत मल्टीमीडिया मॉडेल्सच्या मागणीत वाढ झाली आहे जी अधिक महत्त्वाच्या आणि कामगिरीच्या मानकांसह समान मालिकेतील सर्वात मोठ्या मॉडेल्ससाठी स्पर्धात्मक परिणाम दर्शवते.
मॉडेल आता डाउनलोड करण्यास विनामूल्य आहे:
विकसक आलिंगन चेहर्याचा ट्रान्सफॉर्मर्स, डॉकर कंटेनर किंवा अलिबाबा व्हीएलएलएम अनुप्रयोगाचा वापर करून त्यांच्या पाइपलाइनमध्ये मॉडेल समाकलित करू शकतात. वेग सुधारण्यासाठी आणि मेमरीचा वापर कमी करण्यासाठी फ्लॅशटेन्टे 2 आणि बीएफ 16 सारख्या पर्यायी सुधारणा समर्थित आहेत.
मोठ्या पॅरामीटर्स मॉडेल्सकडे जाण्यासाठी मानक कार्यप्रदर्शन मजबूत परिणाम दर्शविते
जरी त्याचे आकार कमी असले तरी, क्वेन 2.5-श्रम -3 बी मुख्य मानकांद्वारे स्पर्धात्मक कामगिरी करते:
| एक कार्य | क्वेन 2.5-ओमनी -3 बी | Zwen22.5-ओमनी -7 बी |
|---|---|---|
| सर्वव्यापी (मल्टीमीडिया विचार) | 52.2 | 56.1 |
| फिडेओबेंच (आवाज समजून घेणे) | 68.8 | 74.1 |
| चर्च (प्रतिमा विचार) | 53.1 | 59.2 |
| एमव्हीबेंच (व्हिडिओ विचार) | 68.7 | 70.3 |
| टीटीएस-व्हॅल बियाणे चाचणी करणे कठीण आहे (भाषणाचे पिढी) | 92.1 | 93.5 |
व्हिडिओ आणि भाषण कार्यांमधील अरुंद कामगिरीचे अंतर 3 बी डिझाइनची कार्यक्षमता अधोरेखित करते, विशेषत: अशा भागात जेथे वास्तविक वेळेत परस्परसंवाद आणि आउटपुटची गुणवत्ता.
रिअल टाइम, व्हॉईस सानुकूलन आणि बरेच काही मध्ये भाषण
QWEN2.5-OMNI-3B पद्धतींमध्ये एकाचवेळी इनपुटचे समर्थन करते आणि रिअल टाइममध्ये दोन्ही मजकूर आणि ध्वनी प्रतिसाद तयार करू शकते.
मॉडेलमध्ये ऑडिओ सानुकूलित वैशिष्ट्ये समाविष्ट आहेत, ज्यामुळे वापरकर्त्यांना दोन चेल्सी (महिला) आणि एथन (पुरुष) दरम्यान निवडण्याची परवानगी मिळते-भिन्न अनुप्रयोग किंवा प्रेक्षकांना अनुकूल आहे.
वापरकर्ते केवळ ऑडिओ किंवा मजकूर प्रतिसाद परत केले जातील की नाही हे कॉन्फिगर करू शकतात आणि आपल्याला आवश्यक नसताना ध्वनी पिढी अक्षम करून मेमरीचा वापर कमी केला जाऊ शकतो.
समुदाय वाढ आणि इकोसिस्टम
क्वेन टीम त्याच्या कार्यासाठी स्त्रोताच्या खुल्या स्वरूपावर जोर देते, साधन गट, आधीची तपासणी बिंदू, एपीआय मार्गदर्शक आणि प्रकाशन मार्गदर्शकांना विकसकांना द्रुतगतीने प्रारंभ करण्यास मदत करते.
या आवृत्तीमध्ये क्वेन 2.5-श्रम मालिकेच्या शेवटच्या गतीचे अनुसरण केले गेले आहे, जे ट्रेंडिंग मिगिंग फेस सीरिजवरील सर्वोच्च वर्गीकरणात पोहोचले आहे.
क्वेन टीमच्या जुन्यांग लिनने एक्सवरील आवृत्तीमागील प्रेरणा यावर भाष्य केले: “बरेच वापरकर्ते प्रकाशनासाठी लहान ओम्नीची आशा बाळगतात, तर आम्ही हे तयार करतो.”
तांत्रिक निर्णय निर्मात्यांसाठी याचा अर्थ काय आहे?
कृत्रिम बुद्धिमत्ता, समन्वय आणि पायाभूत सुविधा धोरण विकसित करण्यासाठी जबाबदार असलेल्या संस्थांच्या निर्णय निर्मात्यांसाठी, क्वेन 2.5-यूएम -3 बी रिलीज पहिल्या दृष्टीक्षेपात दिसू शकते, जसे की व्यावहारिक उडी फॉरवर्ड. ऑपरेशनल व्यवहार्यतेच्या बाबतीत 24 जीबी असलेल्या ग्राहक ग्राफिक्स प्रोसेसिंग युनिट्सवर चालत असताना मल्टीमीडिया कॉम्प्रेस्ड मॉडेल त्याच्या 7 बी भावाच्या विरूद्ध स्पर्धात्मक कामगिरी प्रदान करते. परंतु कोणत्याही मुक्त स्त्रोत तंत्रज्ञानाप्रमाणेच परवाना देण्याचे मुद्दे आणि या प्रकरणात, परवाना शोध आणि प्रकाशन दरम्यान निश्चित मर्यादा काढतो.
QWEN2.5-UMEI-3B मॉडेल केवळ क्वेन क्लाऊड क्वेन परवाना करारा अंतर्गत गैर-व्यावसायिक वापरासाठी परवानाकृत आहे. याचा अर्थ असा आहे की संस्था अंतर्गत शोध उद्देशाने त्यांचे मॉडेल किंवा मोजमाप करू शकतात किंवा मोजू शकतात परंतु ते क्लाउड अलिबाबाकडून प्रथम स्वतंत्र व्यावसायिक परवाना मिळविल्याशिवाय ग्राहक किंवा सानुकूल सेवांना सामोरे जाणारे अनुप्रयोग किंवा सानुकूल सेवांसारख्या व्यावसायिक सेटिंग्जमध्ये प्रकाशित केले जाऊ शकत नाहीत.
कृत्रिम बुद्धिमत्ता मॉडेलच्या जीवनशैलीची देखरेख करणार्या व्यावसायिकांसाठी – ग्राहकांच्या वातावरणाद्वारे पसरलेले असो, व्यापक समन्वय किंवा मल्टीमीडिया साधने सध्याच्या पाइपलाइनमध्ये समाकलित करतात – हे निर्बंध महत्त्वपूर्ण बाबी प्रदान करतात. क्वेन 2.5-यूएनएमआय -3 बीची भूमिका व्यवहार्यतेसाठी चाचणीमध्ये तयार-टू-प्रकाशित समाधानास किंवा मॉडेलकडे जाण्याचा मार्ग बदलू शकते किंवा व्यावसायिकरित्या परवानाधारक किंवा वैकल्पिक पाठपुरावा होईल की नाही हे ठरविण्यापूर्वी मल्टीमीडिया प्रतिक्रियांचे मूल्यांकन करू शकते.
ऑर्केस्ट्रेशन आणि ऑप्समधील लोक अजूनही अंतर्गत वापरासाठी मॉडेलचा अनुभव घेऊ शकतात – जसे की पाइपलाइन सुधारणे, इमारत साधने किंवा मानक – जोपर्यंत तो अद्याप शोध मर्यादेत आहे. डेटा अभियंता किंवा सुरक्षा नेते अंतर्गत कार्ये किंवा गुणवत्ता आश्वासन कार्यांसाठी मॉडेल एक्सप्लोर करू शकतात, परंतु उत्पादन वातावरणात मालकी किंवा ग्राहक डेटासह त्याचा वापर विचारात घेतल्यास त्यांनी काळजीपूर्वक विचार केला पाहिजे.
येथे वास्तविक रेडी-मेड जेवण प्रवेश आणि निर्बंधांबद्दल असू शकते: क्यूएन 2.5-शम -3 बी मल्टीमीडिया बुद्धिमत्ता अनुभवण्यासाठी तंत्रज्ञान आणि डिव्हाइसमधील अडथळा कमी करते, परंतु त्याचा सध्याचा परवाना व्यावसायिक सीमा लादतो. असे केल्याने, कार्यसंघ कल्पनांच्या चाचणीसाठी, संरचनेचे मूल्यांकन करण्यासाठी किंवा अलिबाबाला परवाना चर्चा करण्यासाठी सामील करू इच्छिणा those ्यांसाठी मेक-व्हीएस-बाय निर्णय-निवारण उत्पादनास सूचित करण्यासाठी एक उच्च-कार्यक्षम मॉडेल प्रदान करते.
या संदर्भात, QWEN2.5-UMEI-3B हा वितरण आणि ऑपरेशन पसरविण्याचा सर्वात कमी पर्याय बनला आहे आणि कमी संसाधनांसह मल्टीमोडल इंटेलिजेंसकडे जाण्याचे सर्वात धोरणात्मक मूल्यांकन साधन-एक साधन आहे, परंतु उत्पादन की सोडविल्यानंतर नाही.
Source link
















