ब्रिटीश कंपनीकडून कृत्रिम बुद्धिमत्तेमधून आवाज काढून टाकण्याचे एक नवीन साधन अमेरिका आणि चिनी भाषेतील काही प्रतिस्पर्ध्यांपेक्षा यूके बोलीभाषांच्या गटाचे अधिक अचूकपणे पुनरुत्पादित करण्यास सक्षम असल्याचा दावा करतो.

कृत्रिम बुद्धिमत्ता उत्पादनांना प्रशिक्षित करण्यासाठी पारंपारिकपणे वापरल्या गेलेल्या डेटापैकी अनेक इंग्रजी भाषेतील उत्तर किंवा दक्षिण अमेरिकन स्त्रोतांकडून येत असल्याने, बरेच कृत्रिम आवाज समान दिसतात.

याचा सामना करण्यासाठी, सिंथेशियाने स्टुडिओमध्ये लोकांची नोंदणी करून आणि ऑनलाइन साहित्य गोळा करून, प्रादेशिक बोलीभाषासह यूकेचा डेटाबेस गोळा करण्यासाठी एक वर्ष व्यतीत केले आहे.

मी एक्सप्रेस-व्हॉईस नावाच्या उत्पादनास प्रशिक्षण देण्यासाठी वापरले, जे एखाद्या वास्तविक व्यक्तीचा आवाज क्लोन करू शकतात किंवा कृत्रिम आवाज तयार करू शकतात.

हे व्हिडिओ प्रशिक्षण, विक्री समर्थन आणि सादरीकरणे यासारख्या सामग्रीमध्ये वापरले जाऊ शकते.

कंपनीने सांगितले की आपल्या ग्राहकांना अधिक अचूक प्रादेशिक प्रतिनिधित्व हवे आहे.

“जर आपण एखाद्या कंपनीचे मुख्य कार्यकारी अधिकारी असाल किंवा आपण फक्त एक सामान्य व्यक्ती असाल तर, जेव्हा आपल्याला शंका असेल तर आपण आपला उच्चारण ठेवू इच्छित असाल,” असे संशोधन प्रमुख युसेफ एम्मी मॅगाटी म्हणाले.

त्यांनी जोडले की फ्रेंच -स्पीकिंग क्लायंटने असेही टिप्पणी केली की फ्रेंच कृत्रिम आवाज फ्रान्सने तयार करण्याऐवजी फ्रेंच कॅनेडियन असल्याचे दिसून येते.

ते म्हणाले, “हे मॉडेल तयार करणार्‍या कंपन्या उत्तर अमेरिकेत कंपन्या आहेत आणि त्या लोकसंख्येच्या रचनेकडे पक्षपाती डेटा गट आहेत.”

श्री. मेजाती म्हणाले की, त्यांनी तळलेली सर्वात कठीण बोली सर्वात कमी सामान्य आहेत, कारण कृत्रिम बुद्धिमत्ता मॉडेलला प्रशिक्षण देण्यासाठी कमी नोंदणीकृत साहित्य उपलब्ध आहे.

असेही अहवाल आहेत की स्मार्ट स्पीकर्ससारख्या व्होकल इंटेलिजेंस उत्पादने, बोलीभाषांचा एक संच समजून घेण्यासाठी संघर्ष करतात.

गेल्या वर्षी, वेस्ट मिडलँड्स पोलिसांच्या अंतर्गत कागदपत्रांमध्ये ध्वनी ओळख प्रणाली ब्रेमियन अॅक्सेंट समजेल की नाही याबद्दल चिंता व्यक्त केली गेली.

दरम्यान, अमेरिकेवर आधारित सानास कंपनी त्याच्या उलट मुख्यालयाचे अनुसरण करते, ब्रूमबर्गने मार्चमध्ये नमूद केल्याप्रमाणे भारतीय आणि फिलिपिन्सच्या कर्मचार्‍यांच्या बोलीभाषा “तटस्थ” करणार्‍या संप्रेषण केंद्रांमध्ये प्रकाशित करण्यासाठी साधने विकसित केली आहेत.

कंपनीचे म्हणणे आहे की जेव्हा कॉलर त्यांना समजण्यास अपयशी ठरतात तेव्हा कामगारांना त्रास सहन करावा लागणारा “स्वरातील भेदभाव” कमी करणे हे आहे.

डिजिटल युगातील भाषा आणि बोलींच्या नुकसानीबद्दल चिंता आहे.

“आजही सात हजाराहून अधिक भाषांपैकी जवळपास अर्ध्या भाषेत युनेस्कोच्या म्हणण्यानुसार नामशेष होण्याची धमकी दिली जाते; सुमारे एक तृतीयांश ऑनलाइन अस्तित्व आहे; Google च्या 2 टक्क्यांपेक्षा कमी अनुवादाद्वारे समर्थित आहे; आणि ओपनई चाचणीनुसार केवळ पंधरा टक्के लोक पुस्तकांच्या पुस्तकाच्या 80 टक्के वरील 80 टक्के आहेत,”

“भाषेचे मॉडेल एक एकसंध भाषण आहे,” कृत्रिम बुद्धिमत्ता तज्ञासाठी सर्वात पात्र हेन्री, जे सिंथेशियासह सरकार आणि तंत्रज्ञान कंपन्यांना सल्ला देतात.

तथापि, ही उत्पादने जितकी चांगली असतील तितकीच ते फसवणूक करणार्‍यांच्या हातात अधिक प्रभावी असतात.

सिंथेशिया उत्पादन येत्या आठवड्यात सोडले जाते तेव्हा ते विनामूल्य होणार नाही आणि त्यात द्वेषयुक्त भाषण आणि स्पष्ट सामग्रीबद्दल पदवी असेल.

परंतु आधीपासूनच बरीच विनामूल्य मुक्त स्त्रोत ध्वनी विल्हेवाट लावण्याची साधने आहेत जी सहजपणे प्रवेश करण्यायोग्य आणि कमी संरक्षण असू शकतात.

जुलैच्या सुरूवातीस, अमेरिकेचे राज्य सचिव मार्को रुबिओ यांना प्रतिबिंबित करणारे एआय-स्क्लोन व्हॉईसने तयार केलेल्या संदेशांना मंत्र्यांना कळविण्यात आले.

“नऊ ते 12 महिन्यांत ध्वनीचा मुक्त स्त्रोत खूप लवकर विकसित झाला आहे.”

“सुरक्षेच्या दृष्टीकोनातून ही एक वास्तविक चिंता आहे.”

Source link