उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


फेसट्यून आणि व्हिडीओएलईएपी सारख्या प्रसिद्ध सर्जनशील अनुप्रयोगांमागील कंपनी लाइट्रिक्सने आज बुद्ध्यांक निर्माण करण्यासाठी सर्वात शक्तिशाली मॉडेलच्या रिलीझची घोषणा केली. एलटीएक्स व्हिडिओ 13 अब्ज पॅरामीटर्स (एलटीएक्सव्ही -13 बी) महागड्या संस्थात्मक ग्राफिक्स प्रोसेसिंग युनिटऐवजी ग्राहक उपकरणांवर ऑपरेशन दरम्यान 30 वेळा कृत्रिम बुद्धिमत्तेचा उच्च-गुणवत्तेचा व्हिडिओ तयार करतात.

मॉडेल एक “मल्टी -रेंज” ऑफर करते, एक नवीन तांत्रिक दृष्टीकोन जो तपशीलांच्या पुरोगामी स्तरांमध्ये व्हिडिओ व्युत्पन्न करून कार्यक्षमता मोठ्या प्रमाणात वाढवते. हे निर्मात्यांना विशेष संस्था उपकरणांची विनंती करण्याऐवजी मानक ऑफिस संगणक आणि प्रगत लॅपटॉपवर व्यावसायिक कर्जमाफी आंतरराष्ट्रीय व्हिडिओ तयार करण्यास सक्षम करते.

“आमच्या 13 बी व्हिडिओ शिक्षकांच्या व्हिडिओची ओळख कृत्रिम बुद्धिमत्तेवरून व्हिडिओ तयार करण्याचा एक महत्त्वाचा क्षण आहे ज्यामुळे ग्राहक ग्राफिक्स प्रोसेसिंग युनिट्सवर उच्च -गुणवत्तेचे उच्च -गुणवत्तेचे व्हिडिओ तयार करण्याची क्षमता आहे,” व्हेंचरबेटच्या एका अनन्य मुलाखतीत झेव फार्मन, लाइटट्रिकचे सह -फर्मन म्हणाले. “आमचे वापरकर्ते आता अधिक सुसंगतता, उत्कृष्ट गुणवत्ता आणि सर्वात कठोर नियंत्रणासह सामग्री तयार करू शकतात.”

https://www.youtube.com/watch?

जीपीयू मेमरी समस्येचे निराकरण करून लाइट्रिक्स कृत्रिम बुद्धिमत्ता व्हिडिओ कसे समाकलित करतात

व्हिडिओ बुद्धिमत्ता व्युत्पन्न करण्याचे मुख्य आव्हान म्हणजे प्रचंड गणिताची आवश्यकता. रनवे, पीआयकेए आणि लुमा सारख्या कंपन्यांचे अग्रगण्य मॉडेल सामान्यत: 80 जीबी किंवा त्यापेक्षा जास्त व्हीआरएएम (व्हिडिओ मेमरी) असलेल्या संस्थांच्या स्तरावर एकाधिक ग्राफिक्स प्रोसेसिंग युनिट्सवर क्लाऊडमध्ये कार्य करतात, जे बहुतेक वापरकर्त्यांसाठी स्थानिक प्रकाशन अनुचित बनतात.

फार्बमन यांनी एलटीएक्सव्ही -13 बी या निर्बंधाचा कसा उपचार करतो हे स्पष्ट केले: “ग्राहक आणि संस्थात्मक ग्राफिक्स प्रोसेसिंग युनिटमधील मुख्य विभाग लाइन व्हीआरएएम आहे.

या ग्राहकांच्या निर्बंधामध्ये नवीन मॉडेल प्रभावीपणे डिझाइन केले आहे. “संपूर्ण मॉडेल, कोणत्याही रकमेशिवाय, कोणत्याही अंदाजेशिवाय, लॅपटॉप आवृत्त्यांसह 3090, 4090, 5090 – उत्कृष्ट ग्राहक ग्राफिक्स प्रोसेसिंग युनिट्सवर चालविण्यास सक्षम असेल,” फार्मनने नमूद केले.

“मल्टी -स्टँडर्ड” च्या आत: कृत्रिम बुद्धिमत्ता बनविणार्‍या कलाकाराद्वारे प्रेरित तंत्र

एलटीएक्सव्ही -13 बी च्या कार्यक्षमतेमागील प्राथमिक नावीन्य एक बहु-प्रमाणित दृश्य आहे, जे फार्ममनने “या आवृत्तीचा सर्वात मोठा कलात्मक प्रवेश” म्हणून वर्णन केला आहे.

ते म्हणाले, “हे मॉडेलला हळूहळू तपशील तयार करण्यास अनुमती देते,” ते म्हणाले. “आपण खडबडीत नेटवर्कपासून प्रारंभ करा, देखावा अंदाजे अंदाजे अंदाजे, हालचाली करणार्‍या गोष्टींची हालचाल इत्यादी. नंतर देखावा टाइलमध्ये विभागला गेला. प्रत्येक टाइल हळूहळू अधिक तपशीलांनी भरली जाते.”

ही प्रक्रिया जटिल दृश्यांसह कसे व्यवहार करते हे प्रतिबिंबित करते – हळूहळू अधिक अचूक तपशील जोडण्यापूर्वी खडबडीत ग्राफिक्ससह प्रारंभ. व्हेरमन म्हणाले की कृत्रिम बुद्धिमत्तेचा फायदा असा आहे की “व्हीआरएएमची आपली पीक रक्कम अंतिम अचूकता नव्हे तर टाइलच्या आकारापुरती मर्यादित आहे.”

मॉडेलमध्ये अधिक दबाव -अंतर्गत जागा देखील दर्शविली जाते, ज्यास गुणवत्ता राखताना कमी मेमरी आवश्यक असते. फार्बमन जोडले: “व्हिडिओंसह, आपल्याकडे जास्त दाब दर आहे जो आपल्याला अंतर्निहित जागेत असताना केवळ व्हीआरएएम घेण्यास परवानगी देतो.”

परफॉरमन्स उपाय जे लाइट्रिक्सचे एलटीएक्सव्ही -13 बी दर्शवितात, जे समतुल्य डिव्हाइसवरील प्रतिस्पर्धी मॉडेलसाठी अंदाजे 40 एक्स वेगात प्रतिस्पर्धी मॉडेलसाठी 1491 सेकंदांपेक्षा जास्त वेळा व्हिडिओ व्युत्पन्न करते. (क्रेडिट: लाइट्रिक्स)

कृत्रिम बुद्धिमत्ता बाजारपेठ वाढत्या प्रमाणात बंद असताना ओपन सोर्सवर लाइट्रिक्स का पैज लावतात?

बरीच कृत्रिम बुद्धिमत्ता मॉडेल्स बंद अनुप्रयोग प्रोग्रामिंगच्या दर्शनी भागामागे आघाडीवर असताना, त्यांनी लाइट्रिक्स एलटीएक्सव्ही -13 बी पूर्णपणे खुले केले आहेत आणि ते मिठी आणि जयताब दोन्हीवर उपलब्ध आहेत. हा निर्णय व्यावसायिक स्पर्धेतून मुक्त स्त्रोत कृत्रिम बुद्धिमत्ता आव्हाने विकसित करण्यासाठी समोरासमोर आला आहे.

“एक वर्षापूर्वी, गोष्टी बंद होत्या, परंतु गोष्टी एक प्रकारची मोकळेपणा आहेत. आम्हाला बरेच चांगले एलएलएम आणि स्प्रेड मॉडेल उघडलेले दिसतात,” फर्बमन म्हणाले. “मी अर्ध्या वर्षापूर्वीच्या तुलनेत आता अधिक आशावादी आहे.”

मुक्त स्त्रोत धोरण संशोधन आणि सुधारणेस गती देण्यास देखील मदत करते. “खुल्या स्त्रोतांच्या वापराची मुख्य तर्कसंगतता म्हणजे आपली संशोधन आणि विकास खर्च कमी करणे,” व्हर्जने स्पष्ट केले. “शैक्षणिक मंडळांमध्ये बरेच लोक आहेत जे मॉडेल वापरतात, कागदपत्रे लिहितात आणि सोन्याचे वास्तविक स्थान समजणारे हे समन्वयक बनू लागले.”

गहन प्रशिक्षण डेटा वापरणार्‍या कृत्रिम बुद्धिमत्ता कंपन्यांविरूद्ध कायदेशीर आव्हाने निर्देशित केल्या गेल्या आहेत, म्हणून मॉडेलवरील परवानाधारक सामग्रीमध्ये प्रवेश करण्यासाठी लाइट्रिक्सला गेटी इमेजेस आणि शटरस्टॉकशी भागीदारी मिळाली आहे.

“कृत्रिम बुद्धिमत्ता मॉडेल्सना प्रशिक्षण देण्यासाठी डेटा संकलन अद्याप एक कायदेशीर राखाडी क्षेत्र आहे,” वर्मनने कबूल केले. “आमच्याकडे आमच्या संस्थांच्या क्षेत्रातील प्रमुख ग्राहक आहेत ज्यांना या प्रकारच्या गोष्टींमध्ये रस आहे, म्हणून आम्ही त्यांच्यासाठी स्वच्छ मॉडेल्स प्रदान करू शकतो हे सुनिश्चित करणे आवश्यक आहे.”

या भागीदारीमुळे लाइट्रिक्सला असे मॉडेल प्रदान करण्याची परवानगी मिळते ज्यामध्ये व्यावसायिक अनुप्रयोगांमध्ये कायदेशीर जोखीम कमी होते, ज्यामुळे त्यांना कॉपीराइटच्या मुद्द्यांशी संबंधित संस्थांच्या बाजारपेठेत फायदा होऊ शकेल.

जुगार धोरणः स्टार्टअप्समध्ये लाइट्रिक्स विनामूल्य प्रगत एआय मॉडेल का ऑफर करतात

कृत्रिम बुद्धिमत्ता उद्योगाच्या विलक्षण चरणात, लाइट्स एलटीएक्सव्ही -13 बी वार्षिक उत्पन्नाच्या 10 दशलक्ष डॉलर्सपेक्षा कमी असलेल्या संस्थांना परवाना संस्थांना विनामूल्य संस्था ऑफर करते. या दृष्टिकोनाचे उद्दीष्ट विकसक आणि कंपन्यांचा समुदाय तयार करणे आहे जे उत्पन्नापूर्वी मॉडेलचे मूल्य दर्शवू शकतात.

“असा विचार करणे म्हणजे शैक्षणिक मंडळे हुकच्या बाहेर आहेत. हे लोक मॉडेलसह जे हवे ते करू शकतात,” वारमन म्हणाले. “स्टार्टअप्स आणि उद्योगासह, आपल्याला दोन्ही बाजूंसाठी फायदेशीर परिस्थिती निर्माण करायची आहे. अ‍ॅम्नेस्टी आंतरराष्ट्रीय गोष्टी खेळणार्‍या कलाकारांच्या समाजातून आपण बरेच पैसे कमवू शकता असे मला वाटत नाही.”

मॉडेलसह यश मिळविणार्‍या मोठ्या कंपन्यांसाठी, लाइट्रिक्स गेम इंजिन यशस्वी विकसकांना कसे लावतात यासारखेच परवाना देण्याच्या करारावर बोलणी करण्याची योजना आखत आहेत. “एकदा ते दहा दशलक्ष महसूल गाठले की आम्ही त्यांच्याशी परवान्याबद्दल बोलू,” वर्मन यांनी स्पष्ट केले.

एलटीएक्सव्ही -13 बी द्वारे दर्शविलेले प्रगती असूनही, फर्बमन कबूल करतो की कृत्रिम बुद्धिमत्ता व्हिडिओच्या पिढीला अद्याप निर्बंध आहेत. ते म्हणाले, “जर आपण स्वतःशी प्रामाणिक राहिलो आणि सर्वोत्कृष्ट मॉडेल्सकडे पाहिले तर आम्ही अजूनही हॉलीवूडच्या चित्रपटांपासून दूर आहोत. ते अद्याप तेथे नाही,” तो म्हणाला.

तथापि, हे अ‍ॅनिमेशनसारख्या क्षेत्रात त्वरित व्यावहारिक अनुप्रयोग पाहते, जेथे सर्जनशील व्यावसायिक वेळ उत्पादनाच्या पैलूंचा सामना करण्यासाठी कृत्रिम बुद्धिमत्ता वापरू शकतात. “जेव्हा आपण प्रगत अ‍ॅनिमेशन, वास्तविक सर्जनशील कार्य आणि जे लोक मुख्य टायर आणि कथेबद्दल विचार करतात अशा लोकांबद्दल विचार करता तेव्हा अर्थसंकल्पातील एक लहान शताब्दी आहे. परंतु मुख्य फ्रेम एक उत्तम स्त्रोत आहे,” फार्मन यांनी लक्ष वेधले.

भविष्याकडे पहात असताना, फार्बमनला अशी अपेक्षा आहे की खालील सीमा मल्टीमीडिया व्हिडिओ मॉडेल असतील जे विविध प्रकारचे माध्यमांना सामान्य अंतर्निहित जागेत समाकलित करतात. “संगीत, ध्वनी, व्हिडिओ इत्यादी असतील, मग चांगल्या ओठ समक्रमणासारख्या गोष्टी सुलभ होतील. या सर्व गोष्टी अदृश्य होतील. आपल्याकडे हे मल्टीमीडिया मॉडेल असेल जे या सर्व भिन्न पद्धतींमध्ये कसे कार्य करावे हे माहित आहे.”

एलटीएक्सव्ही -13 बी आता ओपन सोर्स आवृत्ती म्हणून उपलब्ध आहे आणि आघाडीच्या स्टोरीटेलिंग प्लॅटफॉर्म, एलटीएक्स स्टुडिओसह क्रिएटिव्ह लाइट्रिक अ‍ॅप्समध्ये एकत्र केले आहे.


Source link