रोबोट्सनी आता तंत्रज्ञानाच्या प्रगतीमध्ये सर्वात गुंतागुंतीच्या मानवी वर्तनांमध्ये, ओठांच्या हालचालींमध्ये प्रभुत्व मिळवले आहे.

समोरासमोरील संवादादरम्यान आमचे जवळजवळ अर्धे लक्ष ओठांच्या हावभावांवर केंद्रित असल्याने, चेहऱ्यावरील हावभावातील अगदी थोडासा बदल देखील लक्षात घेण्यास आम्ही इतके सक्षम आहोत यात आश्चर्य नाही.

आत्तापर्यंत, मानव ज्या प्रकारे ओठ हलवतात त्याचे अनुकरण करण्यासाठी यंत्रमानवांनी धडपड केली आहे, अनेकदा ते थोडेसे अनियमित दिसतात. हे एक “अनकॅनी व्हॅली” प्रभाव निर्माण करू शकते – जवळजवळ मानवी दिसणाऱ्या परंतु योग्य वाटत नसलेल्या एखाद्या गोष्टीचा सामना करण्याची एक भयानक भावना

पण माणसांपासून वेगळे न करता येणाऱ्या रोबोट्सच्या भविष्यात ते बदलणार आहे.

कोलंबिया विद्यापीठातील अभियंत्यांनी बुधवारी जाहीर केले की त्यांनी प्रथमच भाषण आणि गाण्यासाठी चेहऱ्याच्या ओठांच्या हालचाली शिकण्यास आणि पुन्हा तयार करण्यास सक्षम रोबोटचा शोध लावला आहे.

यंत्रमानवाने आपल्या 26 चेहऱ्यावरील मोटर्स वापरण्याची क्षमता यूट्यूबचे तासनतास व्हिडिओ पाहून आणि आरशात त्याचे प्रतिबिंब पाहून मानवी ओठांच्या हालचालींचे अनुकरण करण्याचा सराव करून शिकला.

यंत्रमानवाने आपल्या 26 चेहऱ्यावरील मोटर्स वापरण्याची क्षमता यूट्यूबचे तासनतास व्हिडिओ पाहून आणि आरशात त्याचे प्रतिबिंब पाहून मानवी ओठांच्या हालचालींचे अनुकरण करण्याचा सराव करून शिकला.

यंत्रमानवाने आपल्या 26 चेहऱ्यावरील मोटर्स वापरण्याची क्षमता यूट्यूबचे तासनतास व्हिडिओ पाहून आणि आरशात त्याचे प्रतिबिंब पाहून मानवी ओठांच्या हालचालींचे अनुकरण करण्याचा सराव करून शिकला. (जेन नेल्सनसन/कोलंबिया अभियांत्रिकी)

संशोधकांनी दाखवून दिले की त्यांचा रोबोट अनेक भाषांमध्ये शब्द कसे उच्चारू शकतो आणि त्याच्या एआय-व्युत्पन्न पहिल्या अल्बम, “हॅलो वर्ल्ड_” मधील एक गाणे देखील गायला आहे, जर्नल सायन्स रोबोटिक्समध्ये.

“तुम्ही माणसांशी जितके अधिक संवाद साधाल तितके चांगले तुम्हाला मिळेल,” असे वचन अभियंते हूड लिपसन आणि जेम्स आणि सॅली स्कप्पा कोलंबियातील क्रिएटिव्ह मशीन्स प्रयोगशाळेत देतात, जिथे काम केले गेले होते.

संशोधक कबूल करतात की ओठांची हालचाल परिपूर्ण नाही. “आम्हाला ‘बी’ सारख्या कठीण आवाजात आणि ‘डब्ल्यू’ सारख्या ओठांना कुरवाळणे समाविष्ट असलेल्या आवाजांमध्ये विशेष अडचणी होत्या. परंतु या क्षमतांमध्ये वेळ आणि सरावाने सुधारणा होण्याची शक्यता आहे,” श्री लिपसन म्हणाले.

“आज बरेच ह्युमनॉइड रोबोट चालणे आणि पकडणे यासारख्या क्रियाकलापांसाठी पाय आणि हाताच्या हालचालींवर लक्ष केंद्रित करतात,” लिपसन म्हणाले. “परंतु मानवी संवादाचा समावेश असलेल्या कोणत्याही रोबोटिक ऍप्लिकेशनसाठी चेहर्यावरील भावना तितक्याच महत्त्वाच्या असतात.”

“जेव्हा लिप-सिंक करण्याची क्षमता ChatGPT किंवा जेमिनी सारख्या संभाषणात्मक AI सोबत जोडली जाते, तेव्हा त्याचा परिणाम माणसाशी रोबोट बनवलेल्या कनेक्शनमध्ये संपूर्ण नवीन खोली जोडतो,” पीएचडी अभ्यासाचे नेतृत्व करणाऱ्या युहंग हू यांनी स्पष्ट केले.

संशोधकांनी दाखवले की त्यांचा रोबोट अनेक भाषांमध्ये शब्द कसे बोलू शकतो आणि कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या त्याच्या पहिल्या अल्बममधील गाणे देखील गातो.

संशोधकांनी त्यांचा रोबोट अनेक भाषांमध्ये शब्द कसे उच्चारण्यास सक्षम आहे आणि सायन्स रोबोटिक्स जर्नलमध्ये त्याच्या एआय-व्युत्पन्न डेब्यू अल्बम “हॅलोवर्ल्ड_” मधील गाणे देखील कसे गातो याचे पुनरावलोकन केले. (हॅलो वर्ल्ड)

लिपसन आणि त्यांनी भाकीत केले आहे की रोबोट्सवरील उबदार, दोलायमान चेहरे मनोरंजन, शिक्षण, औषध आणि अगदी वृद्धांच्या काळजीसाठी अनुप्रयोग शोधतील. काही अर्थशास्त्रज्ञांचा अंदाज आहे की पुढील दशकात एक अब्जाहून अधिक मानव औद्योगिकीकरण करतील.

लिपसन म्हणतात, “असे कोणतेही भविष्य नाही जिथे या सर्व मानवीय रोबोट्सना चेहरा नसेल. “आणि जेव्हा शेवटी त्यांचा चेहरा असेल, तेव्हा त्यांना त्यांचे डोळे आणि ओठ व्यवस्थित हलवावे लागतील, अन्यथा ते कायमचे विचित्र राहतील.”

रोबोट्सना मानवांशी अधिक प्रभावीपणे संवाद साधण्यासाठी लिपसनच्या दशकभराच्या शोधाचा हा एक भाग आहे. कठोर नियमांचा वापर करून प्रोग्राम करण्याऐवजी या क्षमता शिकून आत्मसात केल्या पाहिजेत असा त्यांचा आग्रह आहे.

तो म्हणाला, “जेव्हा रोबोट फक्त माणसांना पाहून आणि ऐकून हसायला किंवा बोलायला शिकतो तेव्हा काहीतरी जादू घडते.” “मी एक कंटाळवाणा रोबोटिस्ट आहे, परंतु मी मदत करू शकत नाही परंतु त्या रोबोटकडे हसतो जो आपोआप माझ्याकडे हसतो.”

Source link