उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


अलिकडच्या वर्षांत उच्चारण ओळख फॉर्म वाढले आहेत, परंतु सामान्य कारणांसाठी परिपूर्ण परिस्थितीत, स्पष्ट ध्वनी आणि शब्दसंग्रह परिपूर्ण परिस्थितीत तयार आणि मोजले जाऊ शकतात. संस्थांसाठी तथापि, वास्तविक जगातील आवाज अधिक गोंधळलेला आहे.

आयओला जर्गोनिकच्या प्रक्षेपणातून संबोधित करण्याचे हे आव्हान आहे, जे इस्त्रायली तरुणांनी आज प्रकट केलेल्या संस्था वापरण्यासाठी तयार केलेल्या नवीन स्वयंचलित भाषण (एएसआर) ओळखणे आहे.

जर्गोनिक हे विस्तृत री -ट्रेडिंग किंवा कंट्रोलची आवश्यकता नसताना विशिष्ट अटी, पार्श्वभूमी आवाज आणि विविध अॅक्सेंटचा सामना करण्यासाठी डिझाइन केलेल्या मजकूराच्या भाषणाचे एक नवीन मॉडेल आहे.

कृत्रिम बुद्धिमत्तेचे उपाध्यक्ष गिल हिट्झ म्हणाले, “आमचे मॉडेल भाषण ओळखण्यात तीन मुख्य आव्हानांवर लक्ष केंद्रित करते: अटी, पार्श्वभूमी आवाज आणि बोलीभाषा.” “आम्ही एक मॉडेल तयार केले आहे जे निवडलेल्या औद्योगिक अटी शून्य मार्गाने समजते, जोरात वातावरणाशी संबंधित आहे आणि बोलीभाषांच्या विस्तृत श्रेणीचे समर्थन करते.”

एव्हीआय आता आयओला फाउंडेशन प्लॅटफॉर्मवर उपलब्ध आहे, एएसआर म्हणून जर्गोनिक मॅन्युफॅक्चरिंग, लॉजिस्टिकल सर्व्हिसेस, वित्तीय सेवा आणि आरोग्य सेवा यासारख्या उद्योगांमध्ये कंपन्या तयार करण्यास तयार आहे.

आयुला टीम. क्रेडिट: आयला

पहिल्या उत्पादनापासून पहिल्या बुद्धिमत्तेपर्यंत

आयओलावरच लक्ष केंद्रित करण्यामध्ये जर्गोनिकची लाँचिंग ही बदल आहे. कंपनीच्या नेतृत्वानुसार, टीमने कृत्रिम बुद्धिमत्ता आणि प्रकाशन संशोधनाची प्राथमिकता निश्चित करण्याच्या दृष्टिकोनाची पुन्हा व्याख्या केली.

“जेव्हा मी येथे आलो, तेव्हा मी एक आश्चर्यकारक उत्पादन कंपनी पाहिली ज्याने प्रगत कृत्रिम बुद्धिमत्तेच्या क्षमतांमध्ये विस्तृत गुंतवणूक केली आहे, परंतु मी बहुतेक लोकांना मॉडेल्स भरण्यास मदत करण्यासाठी प्रसिद्ध होतो,” आयला मधील मुख्य तंत्रज्ञान आणि उत्पादने अधिकारी असफ असबाग म्हणाले. “आम्ही दृष्टीकोन बदलला आहे आणि आम्ही एआयच्या उत्पादनांऐवजी उत्कृष्ट उत्पादनासह कर्जमाफी आंतरराष्ट्रीय बनलो आहोत.”

“आम्ही जगात आमची क्षमता उघडण्याचे ठरविले,” असबाग जोडले. “केवळ आमच्या उत्पादनांमधील संस्थांसाठी आमच्या मॉडेलची सेवा देण्याऐवजी आम्ही एक अनुप्रयोग प्रोग्रामिंग इंटरफेस विकसित केला आहे आणि आता आमचे प्रतिरोधक मॉडेल सर्वांना उपलब्ध करुन देण्यासाठी ते लाँच केले आहे.”

अटी, शून्य रुपांतर याबद्दल जाणून घ्या

विशिष्ट शब्दसंग्रहातील दृष्टीकोन म्हणजे विशिष्ट शब्दसंग्रह. मानक प्रशिक्षण डेटामध्ये न दिसणार्‍या शब्दाच्या अटींचा सामना करताना स्पीच रिकग्निशन सिस्टम सहसा लढा देतात. जेरगोनिक हे आव्हान विशेष कीवर्ड डिस्कवरी सिस्टमद्वारे करते जे शून्य अनुकूलन-सहभागींना अतिरिक्त री-ट्रेडिंगशिवाय अटींची यादी सबमिट करू शकते.

मानक चाचण्यांमध्ये, जर्गोनिका दर्शविली 5.91 % सरासरी शब्द त्रुटी दर (डब्ल्यूईआर) चार अग्रगण्य इंग्रजी शैक्षणिक डेटा सेट्सद्वारे, ते अकरा लॅब, असेंब्ली एआय, ओपनईची व्हिस्पर आणि डीपग्राम नोव्हा -3 सारख्या प्रतिस्पर्ध्यांना मागे टाकते.

तथापि, कंपनीने विशेषत: ओपनएआय सारख्या सर्वात नवीन मल्टीमीडिया मॉडेल्सच्या तुलनेत कामगिरीची तुलना उघड केली नाही, जी केवळ नऊ दिवसांपूर्वीपर्यंत पोहोचली ज्यामध्ये इंग्रजीमध्ये केवळ 2.46 % असलेल्या डब्ल्यूईआर सारख्या मानकांवर उच्च कामगिरी आहे. आयओला असा दावा करतो की त्याचे मॉडेल अद्याप जर्गॉन विशिष्ट कामे निवडण्यात अधिक चांगले आहे.

खरं तर, जर्गोनिक देखील साध्य केले रिकॉल रेटच्या 89.3 % विशेष आर्थिक परिस्थितीनुसार, बहु -भाषेच्या अटी ओळखण्यात आणि अधिक पोहोचण्यात इतरांना सतत मागे टाकले जाते 95 % अचूकता पाच भाषांद्वारे.

“एकदा आपल्याला भारी अटी मिळाल्यानंतर, ओळखण्याची अचूकता सहसा 20 %कमी होते,” असबागने स्पष्ट केले. “परंतु आमच्या शून्य दृष्टिकोनातून, जिथे आपण केवळ महत्त्वपूर्ण कीवर्ड समाविष्ट करू शकता, अचूकता 95 %पर्यंत वाढते. हे आमच्यासाठी अद्वितीय आहे.”

ही शक्यता दीर्घ -काळ पुन्हा -प्रशिक्षण प्रक्रिया दूर करण्यासाठी डिझाइन केली गेली आहे आणि सामान्यत: विशिष्ट उद्योगांसह एएसआर सिस्टमला अनुकूल करणे आवश्यक असते.

संस्थेच्या वातावरणासाठी ते सुधारले गेले आहे

संस्थात्मक ग्राहकांना उपाययोजना करण्याच्या अनेक वर्षांच्या अनुभवाची माहिती जर्गोनिक डेव्हलपमेंटला देण्यात आली आहे. औद्योगिक आणि व्यावसायिक वातावरणातील महत्त्वपूर्ण आकडेवारीसह, मोठ्या प्रमाणात वास्तववादी वातावरणात टिकाऊपणा सुनिश्चित करून या मॉडेलला दहा लाखाहून अधिक लेखी भाषणात प्रशिक्षण दिले गेले आहे.

हिट्झ म्हणाले, “आम्हाला जे वेगळे करते ते म्हणजे आम्ही वास्तविक जगातील संस्थांच्या समस्यांचे निराकरण करण्यासाठी वर्षे घालविली आहेत,” हिट्झ म्हणाले. “आमच्याकडे वेग, अचूकता आणि जटिल वातावरणाशी सामोरे जाण्याची क्षमता सुधारली आहे केवळ पॉडकास्ट किंवा व्हिडिओच नाही, परंतु गोंगाट करणारा, अराजक आणि वास्तववादी कार्यस्थळ.”

मॉडेलची रचना कीवर्ड एकत्रित करते जी थेट कॉपी प्रक्रियेमध्ये शोधली जाते, जेरगोनिकला अप्रत्याशित ध्वनी परिस्थितीत अचूकता टिकवून ठेवता येते.

पहिले भविष्य

आयलाच्या नेतृत्वासाठी, लोक तंत्रज्ञानासह लोक कसे संवाद साधतात या विस्तृत बदलाच्या दिशेने जर्गोनिक एक पाऊल आहे. कंपनीला केवळ एक कार्य साधन म्हणूनच नव्हे तर मानवी आणि संगणक परस्परसंवादाच्या भविष्यासाठी मूलभूत इंटरफेस म्हणून भाषणाची ओळख दिसून येत नाही.

“आमची दृष्टी अशी आहे की मशीनचा प्रत्येक दर्शनी भाग लवकरच पहिला आवाज होईल,” हिट्झ म्हणाले. “आपण आपल्या रेफ्रिजरेटर, रिक्तपणा आणि कोणत्याही मशीनशी बोलण्यास सक्षम व्हाल – ते कार्य करेल आणि आपल्याला पाहिजे ते करेल. हे आम्ही ज्या भविष्याकडे वळतो तेच हे भविष्य आहे.”

“एआय एक नवीन वेब ब्राउझर बनेल. मशीन्स समजण्यास सुरवात झाली आहे आणि आता आमच्याकडे त्यांच्याशी सामान्यपणे संवाद साधण्याचे कारण आहे.”

सध्या संस्थेचे लक्ष संस्थेवर कायम आहे. JARGONINC त्वरित एपीआय ग्राहकांना उपलब्ध आहे, ज्यामुळे त्यांना भाषण, अनुप्रयोग किंवा ग्राहकांना सामोरे जाणा services ्या सेवांच्या स्वरूपात भाषण ओळखण्याची शक्यता समाकलित करण्याची परवानगी मिळते.


Source link