शांतपणे स्वत:शी काहीतरी बोलण्याची कल्पना करा आणि तुम्ही काय बोलण्याचा प्रयत्न करत आहात हे तुमच्या AI सहाय्यकाला कळेल. हे तुमच्या चष्मा, इयरबड्स किंवा तुमच्या फोनच्या कॅमेऱ्याद्वारे असू शकते. Apple ने नुकतीच Q.ai नावाची कंपनी विकत घेतली आणि ती नेमकी हीच गोष्ट करण्याचा प्रयत्न करत आहे. हे विचित्र आणि साय-फाय वाटतं, परंतु माझ्यासाठी, स्मार्ट चष्मा आणि घालण्यायोग्य गोष्टींकडे बर्याच काळापासून पाहत असलेल्या व्यक्तीच्या रूपात, हे देखील खूप परिचित वाटते.
इस्रायलच्या या स्टार्टअपमध्ये ॲपलची गुंतवणूक अजिबात कमी नाही. फायनान्शियल टाईम्स आणि रॉयटर्स सारख्या मीडिया आउटलेट्सच्या मूळ अहवालानुसार, संपादनासाठी सुमारे $2 अब्ज खर्च आला. एक दशकापूर्वी बीट्सचे जबरदस्त अधिग्रहण केल्यापासून Apple च्या इतर कोणत्याही हालचालींपेक्षा हे अधिक आहे. बीट्सच्या विपरीत, Q.ai बद्दल कोणालाही माहिती नाही. किमान, अद्याप नाही. तथापि, नवीन इंटरफेस तयार करण्याची क्षमता खूप मजबूत असू शकते. भविष्यातील वैयक्तिक तंत्रज्ञान इंटरफेसच्या सतत विस्तारणाऱ्या कोड्यात आणखी एक महत्त्वाचा भाग जोडला जात आहे.
Q.ai ही मी कधीही भेटलेली किंवा डेमो मिळवलेली कंपनी नाही, परंतु तिच्या संस्थापकांपैकी एक, Aviad Maizels, यांनी प्राइमसेन्स, इन्फ्रारेड-आधारित तंत्रज्ञान देखील तयार केले जे Xbox साठी Microsoft च्या Kinect कॅमेराच्या 3D रूम स्कॅनिंग क्षमतांना सामर्थ्य देते. तो प्राइमसेन्स होता ऍपलने विकत घेतले 2013 मध्ये हे तंत्रज्ञान बनले TrueDepth कॅमेरा ॲरे फेस आयडीसाठी, तो त्यात राहतो ऍपल प्रो पहा जवळच्या हँड ट्रॅकिंगसाठी.
त्याच्या पेटंटवर नोंदवलेल्या माहितीच्या आधारावर, Q.ai चेहऱ्याच्या लहान हालचाली आणि भावनिक हावभाव ऑप्टिकल सेन्सर वापरून ट्रॅक करण्यास अनुमती देते आणि AI इंटरफेसमध्ये प्रवेश करण्यासाठी किंवा इतर सूक्ष्म चेहर्यावरील सिग्नल ओळखण्यासाठी मूक आदेश सक्षम करू शकते. इस्त्रायली वेबसाइट GeekTime अधिक तपशीलात जाते, असे म्हणतात की तंत्रज्ञान स्नायू आणि ओठांच्या हालचाली मोजेल आणि ते तुमच्या तोंडाजवळ असणे आवश्यक आहे.
CNET ने टिप्पणीसाठी Apple आणि Q.ai ला संपर्क केला, परंतु दोघांनीही लगेच प्रतिसाद दिला नाही.
व्हिजन प्रो चेहऱ्याच्या हालचालींचा मागोवा घेऊ शकते, परंतु ते ओठांच्या हालचालींना बोलण्यात रूपांतरित करू शकत नाही.
घालण्यायोग्य आणि चष्मासाठी नवीन इंटरफेस प्रणालीचा भाग?
मी नुकतेच लिहिले आहे की ऍपल आधीच कनेक्ट केलेल्या वेअरेबल एआय उपकरणांच्या इकोसिस्टमकडे जाण्याची चिन्हे कशी दर्शवत आहे: पिन, चष्मा, इअरबड्स, घड्याळे किंवा त्यांचे काही संयोजन. यापैकी कोणतेही वेअरेबल संभाव्यपणे Q.ai विकसित होत असलेल्या गोष्टी वापरू शकतात. हेडफोन आणि चष्मा हे बहुधा क्षेत्रे आहेत असे दिसते, असे अहवाल सूचित करतात की… AirPods ची पुढची पिढी त्यात इन्फ्रारेड कॅमेरे असतील, तुकडे जोडण्यासाठी अधिक तयार दिसतील.
व्हिजन प्रो सारख्या मिश्र वास्तविकता हेडसेट देखील Q.ai तंत्रज्ञानाचा फायदा घेऊ शकतात. व्हिजन प्रो आय-ट्रॅकिंग कॅमेरे, डाउनवर्ड-फेसिंग कॅमेरे आणि इन्फ्रारेड सेन्सरद्वारे चेहर्यावरील भाव ओळखू शकतो. परंतु व्हिजन प्रोशी संवाद साधणे माझ्यासाठी अजूनही थोडेसे अस्ताव्यस्त आहे. मी पाहण्यासाठी माझे डोळे आणि वस्तू पिंच करण्यासाठी माझे हात वापरतो, परंतु आवाज विनंत्या करण्यासाठी मला “हे सिरी” म्हणावे लागेल. मी माझे संवाद अधिक नैसर्गिक आणि सूक्ष्म असण्यास प्राधान्य देतो. कदाचित हे नवीन संपादन मदत करू शकेल.
ऑगमेंटेड रिॲलिटी आर्टिस्ट आणि संशोधक हेलन पापागियानिस यांनी तिच्या अलीकडील वृत्तपत्रात नमूद केल्याप्रमाणे, “Apple च्या अफवा पसरवलेल्या AI पिनला Apple च्या इकोसिस्टममधील एक नोड पेक्षा एक स्वतंत्र उत्पादन म्हणून कमी अर्थ प्राप्त होतो, जे सामायिक संवेदना, बुद्धिमत्ता आणि डिव्हाइसेसवर अवलंबून असते जे AirPods, Glasses, आणि Glasses सह एकत्रितपणे कार्य करतात.”
विद्यमान स्मार्ट चष्मा मेल्यासारखा आणि पुढील Google कडून संवादासाठी ते मुख्यतः आवाजावर अवलंबून असतात. हे शांतपणे केल्याने एक मोठा फायदा होऊ शकतो, परंतु आवाजाव्यतिरिक्त इतर पैलू देखील उदयास येत आहेत. मेटामध्ये एक मज्जातंतूचा पट्टा आहे जो मनगटावर परिधान केला जातो, चष्म्यांमध्ये डोळ्यांचा मागोवा जोडणे हे अंतिम ध्येय आहे. गुगल ग्लास वॉच-आधारित जेश्चरसह देखील कार्य करेल.
मला गोपनीयतेची थोडी काळजी आहे. ओठ वाचू शकणारे आणि सूक्ष्म अभिव्यक्ती ओळखणारे कोणतेही तंत्रज्ञान तुमच्या हेतूचा मागोवा घेण्यासाठी आणि ते दूरवरून ऐकण्यासाठी वापरले जाऊ शकते. हे तंत्रज्ञान खाजगी आणि विश्वसनीयरित्या कसे वापरले जाऊ शकते? किंवा मी आता वापरत असलेल्या व्हॉइस कमांडपेक्षा शांतपणे विनंत्या करण्याची क्षमता अधिक खाजगी असेल?
ओठ वाचनाच्या पलीकडे जाण्यासाठी अधिक?
मला अजूनही असे इंटरफेस हवे आहेत जे भाषण अजिबात वापरत नाहीत. मेटा इलेक्ट्रोमायोग्राफीवर आधारित आहे न्यूरल बँड तंत्रज्ञान चष्मा आणि इअरबडसह काम करण्यासाठी मनगटाचे जेश्चर विकसित होऊ शकतात अशा जटिल मार्गांकडे ते निर्देश करते. आणखी एक इस्रायली कंपनी, वेअरेबल डिव्हाइसेस, त्याचे स्वत:चे न्युरोबँड आहे, ज्याला मुद्रा म्हणतात, आणि मोटार न्यूरॉन्सच्या विद्युत आवेगांमध्ये मिळणा-या मायक्रो-इनपुट क्षमतांचा विस्तार करण्याचा उद्देश आहे.
इलेक्ट्रोएन्सेफॅलोग्राफी, जी मेंदूचे सिग्नल मोजते, ही आणखी एक प्रवृत्ती आहे. काही कंपन्या मेंदू-संगणक इंटरफेससाठी ईईजी शोधत असताना, तरीही ही मुख्यतः आरोग्य आणि वैद्यकीय अनुप्रयोगांवर केंद्रित असलेली सेन्सर प्रणाली आहे.
Q.ai तंत्रज्ञान हे इंटरफेसपैकी एक आहे जे आम्ही वापरत असलेले घालण्यायोग्य संगणक आमच्याशी अधिक जोडलेले वाटू शकतात. हे विचित्र आणि भितीदायक आहे, परंतु मला वाटते की बहुतेक चष्मा, घालण्यायोग्य आणि VR/AR कंपन्या आधीच पुढे जात आहेत. हे काही विचित्र नाही. ॲपलची चाल हा या ट्रेंडचा आणखी एक भाग आहे.
















