उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
ट्रान्सफॉर्मर एलएलएमएस मॉडेल आधुनिक बुद्धिमत्तेच्या लँडस्केपचा आधार आहेत.
ट्रान्सफॉर्मर्स हा एकमेव मार्ग नाही सामान्य एआय, तरी. गेल्या वर्षभरात, माम्बा, संघटित स्थिती स्पेस मॉडेल्स (एसएसएम) वापरणारा दृष्टिकोन, एकाधिक विक्रेत्यांकडून पर्यायी दृष्टिकोन म्हणून देखील स्वीकारला आहे, एआय 21 आणि एआय सिलिकॉन राक्षस एनव्हीडियासह.
एनव्हीडियाने प्रथम 2024 मध्ये माम्बामध्ये काम करणार्या मॉडेल्सच्या संकल्पनेवर प्रथम चर्चा केली जेव्हा त्याने सुरुवातीला मॅम्बॅव्हिजन आणि काही प्रारंभिक मॉडेल्स सोडले. या आठवड्यात, एनव्हीडिया मिठीच्या चेह on ्यावर उपलब्ध असलेल्या अद्ययावत मॅम्बॅव्हिजन मॉडेल्सच्या मालिकेद्वारे आपला प्रारंभिक प्रयत्न विस्तृत करते.
नावाप्रमाणेच मॅम्बॅव्हिजन हे संगणक दृष्टी कार्ये आणि फोटो ओळख कार्यांसाठी एक मांबा मॉडेल कुटुंब आहे. फाउंडेशनचे मॅम्बॅव्हिजन वचन असे आहे की ते कमी गणिताच्या आवश्यकतांबद्दल धन्यवाद, संभाव्य खर्चावर दृष्टी प्रक्रियेची कार्यक्षमता आणि अचूकता सुधारू शकते.
एसएसएम म्हणजे काय आणि ट्रान्सफॉर्मर्सची तुलना कशी करावी?
एसएसएमएस ही न्यूरल नेटवर्क स्ट्रक्चरची श्रेणी आहे जी पारंपारिक ट्रान्सफॉर्मर्सपेक्षा वेगळ्या प्रकारे अनुक्रमांक प्रक्रिया करते.
ट्रान्सफॉर्मर्स एकमेकांच्या संबंधात सर्व प्रतीकांवर प्रक्रिया करण्यासाठी लक्ष देणारी यंत्रणा वापरतात, तर एसएसएमएस मॉडेल सीक्वेन्स डेटा सतत डायनॅमिक सिस्टम म्हणून.
मागील एसएसएम मॉडेल्सवरील निर्बंधांवर उपचार करण्यासाठी मांबा हा एक विशिष्ट एसएसएम अॅप आहे. हे प्रभावी जीपीयू वापरण्यासाठी डायनॅमिक डेटा एंट्री आणि डिव्हाइसची ओळखल्या गेलेल्या डिझाइनशी जुळवून घेण्यासाठी निवडक स्थितीची जागा प्रदान करते. कमी अंकगणित संसाधने वापरताना अनेक कामांमध्ये ट्रान्सफॉर्मर्ससाठी समान कामगिरी प्रदान करण्याचे उद्दीष्ट मंबाचे उद्दीष्ट आहे
संगणक दृष्टीने क्रांती घडवून आणण्यासाठी मॅम्बॅव्हिजनसह हायब्रीड आर्किटेक्चर वापरुन एनव्हीडिया
पारंपारिक व्हिजन ट्रान्सफॉर्मर्स (व्हीआयटी) ने गेल्या काही वर्षांमध्ये उच्च -कार्यक्षमता संगणकाच्या दृष्टीने वर्चस्व गाजवले आहे, परंतु मोठ्या खात्याच्या किंमतीवर. शुद्ध मांबा शैली, जरी ते अधिक कार्यक्षम असले तरी, जागतिक संदर्भ समजून घेण्यासाठी आवश्यक असलेल्या जटिल व्हिजन कार्यांमध्ये ट्रान्सफॉर्मर्सच्या कामगिरीशी जुळण्यासाठी संघर्ष केला आहे.
मॅम्बॅव्हिजन हायब्रीड दृष्टिकोन स्वीकारून ही अंतर रोखते. एनव्हीडिया एक संकरित मॉडेल आहे जे धोरणात्मकपणे मंबा कार्यक्षमता आणि ट्रान्सफॉर्मर संयम जोडते.
डिझाइन केलेल्या फॉर्म्युलामध्ये आर्किटेक्चरची निर्मिती ऑप्टिकल वैशिष्ट्यांसाठी खास तयार केली गेली आहे, जी जटिल स्थानिक अवलंबन कॅप्चर करण्यासाठी अंतिम थरांमध्ये स्वत: ची बक्षिसे असलेल्या ब्लॉक्सच्या सामरिक परिस्थितीद्वारे वर्धित केली जाते.
पारंपारिक व्हिजन मॉडेल्सच्या विपरीत जे केवळ लक्ष देण्याच्या यंत्रणेवर किंवा तवाफ्रल पध्दतीवर अवलंबून असतात, मॅम्बॅव्हिजनमधील श्रेणीबद्ध अभियांत्रिकी एकाच वेळी दोन्ही मॉडेल्स वापरते. जागतिक संदर्भात मॉडेलिंगमध्ये स्वत: ची व्याजाचा फायदा घेत असताना वर्ल्ड्समध्ये प्रभावीपणे सर्वोत्कृष्ट होण्यासाठी मॉडेल माम्बा स्कॅनिंग प्रक्रियेद्वारे व्हिज्युअल माहितीशी संबंधित आहे.
मंबॅव्हिजनकडे आता 740 दशलक्ष शिक्षक आहेत
हग्गीवर रिलीज झालेल्या मॅम्बॅव्हिजन मॉडेल्सचे नवीन संग्रहएनजी चेहरा एनव्हीडिया स्त्रोत कोड परवाना, मुक्त परवाना मध्ये उपलब्ध आहे.
२०२24 मध्ये रिलीझ झालेल्या मॅम्बॅव्हिजनच्या सुरुवातीच्या व्हेरिएबल्समध्ये टी 2 व्हेरिएबल्सचा समावेश आहे, जे इमेजनेट -1 के लायब्ररीमध्ये प्रशिक्षित होते. या आठवड्यात रिलीज झालेल्या नवीन मॉडेल्समध्ये एल/एल 2 आणि एल 3 व्हेरिएबल्स समाविष्ट आहेत, जे मर्यादित आहेत.
“सुरुवातीच्या सुटकेपासून, मंबॅविजनने आम्हाला मोठ्या प्रमाणात मजबुती दिली आहे, जिथे आम्ही 740 दशलक्ष प्रभावी शिक्षकांपर्यंत पोहोचलो आहोत,” एनव्हीडियाचे मुख्य संशोधन वैज्ञानिक अली हथामीझादेह यांनी पोस्ट -चर्चेच्या चर्चेत लिहिले. “आम्ही सर्वात मोठा इमेजनेट -21 के डेटा सेट वापरुन आमच्या प्रशिक्षण दृष्टिकोनाचा विस्तार देखील केला आहे आणि आम्ही उच्च निर्णयांसाठी मूळ समर्थन प्रदान केले आहे आणि आता मूळ 224 पिक्सेलच्या तुलनेत 256 आणि 512 पिक्सेलवर चित्रांचे काम केले आहे.”
एनव्हीआयडीएच्या मते, नवीन मॅम्बॅव्हिजन मॉडेल्समधील सुधारित स्केल देखील कामगिरी सुधारते.
स्वतंत्र कृत्रिम बुद्धिमत्ता सल्लागार अॅलेक्स वाझिओ यांनी स्पष्ट केले की बिग डेटावरील नवीन मॅम्बॅव्हिजन मॉडेल्स सर्वात वैविध्यपूर्ण आणि जटिल कार्यांशी संबंधित आहेत.
त्यांनी निदर्शनास आणून दिले की नवीन मॉडेल्समध्ये तपशीलवार प्रतिमांच्या विश्लेषणासाठी योग्य उच्च -रेसोल्यूशन व्हेरिएबल्स समाविष्ट आहेत. वझिओ म्हणाले की, या संग्रहात प्रगत कॉन्फिगरेशनसह विस्तारित केले गेले जे अधिक लवचिकता आणि विविध कामाच्या ओझे वाढवते.
“मानकांच्या बाबतीत, २०२25 मॉडेल्सने २०२24 मॉडेल्सला मागे टाकण्याची अपेक्षा केली आहे कारण ते मोठ्या डेटा आणि कार्यांद्वारे अधिक चांगले सामान्यीकृत आहेत,” फाझिओ म्हणाले.
मॅम्बॅव्हिजन पासून संस्थेचे परिणाम
संगणक व्हिजन अनुप्रयोगांच्या निर्मितीबद्दल, मॅम्बॅव्हिजनमधील कार्यक्षमतेचे आणि कार्यक्षमतेचे संतुलन नवीन शक्यता उघडते
कमी अनुमान खर्च– सुधारित उत्पादकता म्हणजे केवळ ट्रान्सफॉर्मर मॉडेल्सच्या तुलनेत समान कामगिरीच्या पातळीसाठी जीपीयू खाते आवश्यकता कमी आहे.
एज प्रकाशन क्षमताजरी ते अद्याप मोठे असले तरी, क्लीन ट्रान्सफॉर्मर पध्दतींपेक्षा मॅम्बॅव्हिजनची रचना एज डिव्हाइससाठी अधिक सुधारत आहे.
मिशन कामगिरी सुधारणेनफ्याचे जटिल कामांमध्ये भाषांतर केले जाते जसे की वस्तूंचा शोध आणि रिटेल थेट इन्व्हेंटरी मॅनेजमेंट, गुणवत्ता नियंत्रण आणि स्वतंत्र प्रणाली यासारख्या वास्तविक जगाच्या अनुप्रयोगांच्या चांगल्या कामगिरीमध्ये.
प्रीमियमएनव्हीडिया मॅम्बॅव्हिजनने मिठीच्या समाकलनासह रिलीज केले आहे, जे वर्गीकरण आणि वैशिष्ट्ये काढण्यासाठी दोन्ही सॉफ्टवेअर सूचनांच्या काही ओळींसह अंमलबजावणी स्पष्ट करते.
फाउंडेशनच्या एआयच्या रणनीतीसाठी याचा अर्थ काय आहे?
उच्च अचूकता राखणार्या अधिक कार्यक्षम संगणक व्हिजन सिस्टमचा प्रसार करण्याची संस्था मॅम्बॅव्हिजन ही एक संधी आहे. मॉडेलच्या मजबूत कामगिरीचा अर्थ असा आहे की ते उद्योगांमधील एकाधिक संगणक दृष्टीकोन अनुप्रयोगांसाठी बहु -वापर आधार म्हणून काम करू शकते.
मॅम्बॅव्हिजन अजूनही काही प्रमाणात लवकर आहे, परंतु हे संगणक व्हिजन मॉडेल्सच्या भविष्याबद्दल एक झलक दर्शवते.
आर्किटेक्चरल इनोव्हेशन – आणि केवळ आकारच नव्हे तर – कृत्रिम बुद्धिमत्तेच्या क्षमतांमध्ये अर्थपूर्ण सुधारणे कसे सोडते हे मॅम्बॅव्हिजन अधोरेखित करते. तांत्रिक निर्णय निर्मात्यांना अॅम्नेस्टी इंटरनॅशनलची प्रबुद्ध तैनाती करण्यासाठी या आर्किटेक्चरल घडामोडी समजून घेणे फार महत्वाचे झाले आहे.
Source link