उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
रनवे एआय इंक. आज कृत्रिम बुद्धिमत्तेची सर्वात प्रगत व्हिडिओ निर्मितीची मॉडेल्स, स्पर्धेच्या पुढील टप्प्यात फिल्म निर्मितीमध्ये रूपांतरित करणारी साधने तयार करण्यासाठी प्रवेश केला. नवीन GEN-4 सिस्टम एकाधिक शॉट्सद्वारे व्यक्तिमत्त्वाची आणि देखाव्याची सुसंगतता ओळखते-आतापर्यंतच्या बहुतेक एआयच्या व्हिडिओ जनरेटरमधून सुटणारी क्षमता.
या आठवड्याच्या शेवटी अतिरिक्त वैशिष्ट्यांसह, न्यूयॉर्क-आधारित स्टार्टअप कंपनी, Google, एनव्हीआयडीए आणि सेल्सफोर्सच्या समर्थनासह सर्व सशुल्क ग्राहक आणि संस्थात्मक ग्राहकांसाठी “जनरल -4” आहे. वापरकर्ते 720 पिक्सेलचे पाच आणि दहा सेकंद तयार करू शकतात.
ओपनईचे फोटो जनरेशन वैशिष्ट्य तयार केल्यानंतर काही दिवसांनंतर ही आवृत्ती येते, कारण लाखो वापरकर्ते चॅटजीपीटीद्वारे स्टुडिओ गिबली-स्टाईलला विचारतात. अभूतपूर्व मागणीमुळे “जीपीयू वितळण्या” होईपर्यंत ट्विटचे मुख्य कार्यकारी अधिकारी सॅम ऑल्टमॅनसह ओपनई सर्व्हर तात्पुरते क्रॅश झाल्यामुळे व्हायरल ट्रेंड खूप सामान्य झाला. गिबली-शैलीतील प्रतिमांनी कॉपीराइटवर चर्चेतही चर्चेला सुरुवात केली, कारण बर्याच कृत्रिम बुद्धिमत्ता कंपन्यांनी कायदेशीरदृष्ट्या विशिष्ट कलात्मक नमुन्यांची चौकशी केली.
व्हिजनची सातत्य: आतापर्यंत फिल्म इंडस्ट्रीमधील गहाळ तुकडा
कृत्रिम बुद्धिमत्ता व्हिडिओ व्युत्पन्न करण्यासाठी – एकाधिक शॉट्स आणि कोनातून समान दृश्यमान घटकांची देखभाल करणे – चारित्र्य आणि देखावा – समान दृश्यमान घटकांची देखभाल करणे. जेव्हा सूट किंवा पार्श्वभूमी घटक दरम्यान वर्णाचा चेहरा कुशलतेने बदलतो, तेव्हा ते स्पष्टीकरण न देता अदृश्य होते, सामग्रीचे कृत्रिम स्वरूप दर्शकांना त्वरित स्पष्ट होते.
हे मॉडेल मूलभूत स्तरावर कसे कार्य करतात यावरून आव्हान आहे. माजी कृत्रिम बुद्धिमत्ता जनरेटर प्रत्येक फ्रेमला स्वतंत्र सर्जनशील कार्य म्हणून व्यवहार करतात, त्यांच्यात केवळ सैल कनेक्शन आहेत. आधी किंवा नंतर काय घडले हे न पाहता एखाद्या चित्रपटाच्या प्रत्येक फ्रेमसाठी कलाकारांनी भरलेल्या खोलीला विचारण्याची कल्पना करा – परिणाम दृश्यास्पदपणे विभक्त होईल.
असे दिसते आहे की रनवेच्या जनरल -4 ने व्हिज्युअल घटकांच्या सतत स्मृतीपर्यंत या समस्येचा सामना केला आहे. एकदा एखादे पत्र, ऑब्जेक्ट किंवा वातावरण तयार केले की, मूलभूत वैशिष्ट्ये राखताना सिस्टम वेगवेगळ्या कोनातून सादर केली जाऊ शकते. ही केवळ एक कलात्मक सुधारणा नाही; मनोरंजक व्हिज्युअल उतारे आणि वास्तविक कथा तयार करण्यामध्ये फरक आहे.
मार्गदर्शक तत्त्वांसह व्हिज्युअल संदर्भांचा वापर करून, GEN-4 आपल्याला सुसंगत नमुने, विषय, स्थाने आणि बरेच काही नवीन फोटो आणि व्हिडिओ तयार करण्याची परवानगी देते. सातत्य अनुमती द्या आणि आपल्या कथा नियंत्रित करा.
मॉडेलच्या स्वरूपाच्या स्वरूपाची चाचणी घेण्यासाठी आम्ही एकत्र होतो … pic.twitter.com/iyz2baew2U
रनवे (रनवेएमएल) 31 मार्च, 2025
रनवे दस्तऐवजांनुसार, GEN-4 वापरकर्त्यांना विषयांच्या संदर्भ प्रतिमा प्रदान करण्यास आणि त्यांना पाहिजे असलेल्या रचनांचे वर्णन करण्यास अनुमती देते, कृत्रिम बुद्धिमत्तेने वेगवेगळ्या कोनातून सुसंगत आउटपुट व्युत्पन्न केले. कंपनीचा असा दावा आहे की विषय, विषय आणि अभिजाततेची सुसंगतता राखताना मॉडेल वास्तववादी चळवळीसह व्हिडिओ सादर करू शकते.
मॉडेलची क्षमता प्रदर्शित करण्यासाठी, रनवेने GEN-4 सह पूर्णपणे तयार केलेल्या बर्याच शॉर्ट फिल्म्स सोडल्या. न्यूयॉर्कच्या सेटिंग्जमध्ये वास्तववादी प्राणी ठेवून “न्यूयॉर्क एक प्राणीसंग्रहालय आहे”, मॉडेलचे व्हिज्युअल इफेक्ट दर्शविते. आणखी एक, “रिटर्न” शीर्षक, एक रहस्यमय फुल शोधत असलेल्या अन्वेषकांचे अनुसरण करते आणि एका आठवड्यापेक्षा कमी वेळात तयार होते.
चेहर्याच्या अॅनिमेशनपासून ते ग्लोबल मॉडेल्स पर्यंत: एआय रनवे पासून चित्रपट उद्योगाचा विकास
GEN-4 धावपट्टीच्या मागील साधनांवर अवलंबून आहे. ऑक्टोबरमध्ये, अॅक्ट-वन, एक वैशिष्ट्य जे चित्रपट निर्मात्यांना स्मार्टफोन व्हिडिओवरून चेहर्यावरील अभिव्यक्ती कॅप्चर करण्यास आणि कृत्रिम बुद्धिमत्तेतून तयार केलेल्या पात्रांमध्ये हस्तांतरित करण्यास अनुमती देते. पुढच्या महिन्यात, रनवेने GEN-3 अल-टर्बोमध्ये प्रगत 3 डी कॅमेरा नियंत्रणे जोडली, ज्यामुळे वापरकर्त्यांना पत्रे राखताना दर्शकांमधून बाहेर काढण्याची आणि दर्शकांमधून बाहेर पडण्याची परवानगी मिळते.
हा मार्ग धावपट्टीची सामरिक दृष्टी प्रकट करतो. प्रतिस्पर्धी आणखी एक वास्तववादी प्रतिमा किंवा क्लिप तयार करण्यावर लक्ष केंद्रित करीत असताना, संपूर्ण डिजिटल उत्पादन पाइपलाइनच्या घटकांद्वारे रनवे एकत्र केले गेले आहे. हा दृष्टिकोन वास्तविक संचालक कसे कार्य करतात यांच्या जवळ दिसतात – वेगळ्या तांत्रिक अडथळ्यांऐवजी कार्यक्षमता, कव्हरेज आणि व्हिज्युअल सातत्यपूर्ण समस्यांना सामोरे जाणे.
फेस -टू -फेस अॅनिमेशन टूल्सचा विकास सूचित करतो की रनवेला हे समजले आहे की एआय -बॅक्ड फिल्म इंडस्ट्रीला पारंपारिक उत्पादनाच्या तर्कशास्त्राचे अनुसरण करणे खरोखर उपयुक्त ठरेल. तंत्रज्ञान आणि बांधकाम साधनांसाठी प्रायोगिक ऑफर तयार करणे यात फरक आहे जे व्यावसायिक त्यांच्या कार्यप्रवाहामध्ये प्रत्यक्षात समाकलित होऊ शकतात.
लाखो डॉलर्सची अॅम्नेस्टी आंतरराष्ट्रीय व्हिडिओ लढाई वाढत आहे
धावपट्टीसाठी आर्थिक परिणाम मोठे आहेत, जे नवीन वित्तपुरवठा फेरी वाढवण्याची नोंद आहे जी कंपनीचा अंदाज billion अब्ज डॉलर्सवर करेल. फायनान्शियल रिपोर्ट्सनुसार, नवीन उत्पादने आणि त्यांच्या व्हिडिओ निर्मितीच्या मॉडेल्ससाठी अनुप्रयोग प्रोग्रामिंग इंटरफेस सुरू केल्यानंतर यावर्षी वार्षिक महसुलाच्या 300 दशलक्ष डॉलर्सपर्यंत पोहोचण्याचे स्टार्टअप्सचे उद्दीष्ट आहे.
रनवेने हॉलीवूडच्या भागीदारीचा पाठपुरावा केला, जिथे तिला लायन्सगेटशी एक करार मिळाला की एक स्पष्ट व्हिडिओ निर्मिती मॉडेल एआय 20,000 हून अधिक शीर्षकांच्या स्टुडिओ कॅटलॉगवर अवलंबून आहे. कृत्रिम बुद्धिमत्ता वापरुन चित्रपट निर्मात्यांनी चित्रपट निर्माते सादर केल्यामुळे कंपनीने शंभर चित्रपटांची स्थापना केली.
“आमचा विश्वास आहे की सर्वोत्कृष्ट कथा अद्याप सूचीबद्ध केल्या गेल्या नाहीत, परंतु पारंपारिक वित्तपुरवठा यंत्रणा बर्याचदा उद्योगातील सर्वात मोठ्या इकोसिस्टममध्ये नवीन आणि उदयोन्मुख दृष्टिकोनांकडे दुर्लक्ष करतात,” रनवे त्याच्या वेबसाइटवर स्पष्ट करतात.
तथापि, तंत्रज्ञानामुळे चित्रपटसृष्टीत भीती निर्माण होते. अॅनिमेशन सिंडिकेटने सुरू केलेल्या २०२24 मध्ये केलेल्या अभ्यासानुसार असे आढळले आहे की अॅम्नेस्टी इंटरनॅशनलचा अवलंब करणा the ्या चित्रपट निर्मिती कंपन्यांपैकी % 75 % कंपन्या कमी, एकीकृत किंवा रद्द केलेल्या नोकर्या आहेत. 2026 पर्यंत अमेरिकेत 100,000 हून अधिक मनोरंजन नोकर्या इन्स्टेलिजेंस बुद्ध्यांकामुळे प्रभावित होतील अशा अभ्यासाचे प्रकल्प.
कॉपीराइट प्रश्न अॅम्नेस्टी इंटरनॅशनलच्या सर्जनशील स्फोटांचे अनुसरण करतात
इतर कृत्रिम बुद्धिमत्ता कंपन्यांप्रमाणेच रनवेला त्यांच्या प्रशिक्षण डेटावर कायदेशीर ऑडिट देखील आहे. कंपनी सध्या कलाकारांनी दाखल केलेल्या खटल्यात स्वत: चा बचाव करीत आहे, ज्यांचा असा दावा आहे की त्यांचे कॉपीराइट काम परवानगीशिवाय कृत्रिम बुद्धिमत्ता मॉडेल प्रशिक्षित करण्यासाठी वापरले गेले आहे. रनवेने योग्य वापराच्या सिद्धांताचा बचाव म्हणून नमूद केले, जरी न्यायालयांनी अद्याप कॉपीराइट कायद्याच्या या अर्जावर राज्य केले नाही.
ओपनई गिबली स्टुडिओ वैशिष्ट्याद्वारे गेल्या आठवड्यात चर्चा केलेल्या हक्कांचे प्रकाशित करणे, ज्यामुळे वापरकर्त्यांना स्पष्ट परवानगीशिवाय हयाओ मियाझाकी अॅनिमेशनच्या विशिष्ट शैलीत चित्रे तयार करण्याची परवानगी मिळाली. ओपनईच्या विपरीत, जो कलाकारांच्या शैलीत फोटो तयार करण्यास नकार देतो परंतु स्टुडिओ शैलींना परवानगी देतो, रनवेने अभिजाततेचे अनुकरण करण्याबद्दल आपली धोरणे जाहीरपणे स्पष्ट केली नाहीत.
कृत्रिम बुद्धिमत्ता मॉडेल अधिक प्रगत झाल्यामुळे हा भेदभाव वाढत्या प्रमाणात अनियंत्रित होत आहे. विस्तृत तांत्रिक परंपरेतून शिकणे आणि निर्दिष्ट सर्जनशील नमुन्यांची कॉपी करणे यांच्यातील विभक्तता जवळपास स्पष्ट केली गेली आहे. जेव्हा एआय मियाझाकीपासून ते विकसित करण्यासाठी दशके घेतलेल्या व्हिज्युअल भाषेचे अनुकरण करू शकते, तेव्हा आम्ही स्टुडिओ किंवा स्वत: कलाकार कॉपी करण्यास सांगत होतो की नाही हे महत्त्वाचे आहे काय?
प्रशिक्षण डेटा स्रोतांबद्दल चौकशी केल्यावर, रनवेने स्पर्धात्मक चिंता लक्षात घेऊन तपशील प्रदान करण्यास नकार दिला. कृत्रिम बुद्धिमत्तेच्या विकसकांमध्ये हा शहामृग एक प्रमाणित प्रथा बनला आहे, परंतु तरीही निर्मात्यांसाठी हा मतभेद आहे.
मार्केटींग एजन्सीज, शैक्षणिक सामग्री निर्माते आणि कंपन्यांसाठी संप्रेषण कार्यसंघ एक्सप्लोर करताना जीईएन -4 सारखी साधने व्हिडिओ उत्पादन सुलभ कशी करतात, प्रश्न तांत्रिक क्षमतांमधून सर्जनशील अनुप्रयोगाकडे जातो.
संचालकांसाठी तंत्रज्ञान संधी आणि व्यत्यय दर्शवते. स्वतंत्र निर्माते केवळ पूर्वीच्या मोठ्या स्टुडिओसाठी उपलब्ध व्हिज्युअल इफेक्टच्या शक्यतांमध्ये प्रवेश करू शकतात, तर पारंपारिक व्हीएफएक्स व्यावसायिकांना अनिश्चिततेचा सामना करावा लागतो.
अस्वस्थ सत्य हे आहे की तांत्रिक निर्बंधांमुळे बहुतेक लोकांना विश्वासार्ह चित्रपट बनविण्यापासून कधीही प्रतिबंधित केले नाही. व्हिजनची सातत्य राखण्याची क्षमता अचानक कथा सांगण्याच्या अलौकिक बुद्धिमत्तेची पिढी तयार करेल. तथापि, जे काही करू शकते ते प्रक्रियेतून पुरेसे घर्षण दूर करणे आहे जे अधिक लोकांना विशेष प्रशिक्षण किंवा महागड्या उपकरणांची आवश्यकता नसताना दृश्य कथन अनुभवू शकते.
कदाचित जनरल -4 ची सर्वात खोल बाजू ती तयार करू शकत नाही, परंतु दृश्यमान माध्यमांशी असलेल्या आपल्या नातेसंबंधाबद्दल पुढे जाण्यासाठी जे सुचवते. आम्ही अशा युगात प्रवेश करतो ज्यात बाटलीच्या मानात कौशल्य किंवा तांत्रिक बजेट नसते, परंतु कल्पनाशक्ती आणि हेतू असते. एखाद्या जगात कोणी वर्णन करू शकणारी कोणतीही प्रतिमा तयार करू शकते, महत्त्वाचा प्रश्न बनतो: काय प्रदर्शित करणे योग्य आहे?
जेव्हा आम्ही दुपारमध्ये प्रवेश करतो कारण त्यासाठी एकापेक्षा जास्त संदर्भ तयार करणे आणि मागणी करणे आवश्यक असते, तेव्हा सर्वात तातडीचा प्रश्न एआय खात्रीने व्हिडिओ तयार करू शकतो की नाही हे नाही, परंतु आपल्या हातात काही बोलणारी साधने असताना आपल्याला काहीतरी अर्थपूर्ण वाटेल की नाही.
Source link
















