उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
Amazon मेझॉन ई -कॉमर्सचा राक्षस म्हणून प्रसिद्ध आहे, त्यानंतर कुठेतरी एकापेक्षा जास्त ऑफरची यादी अलेक्सा एआय व्हॉईस असू शकते, जी गेल्या महिन्यात अॅमेझॉन नोव्हा आणि Amazon मेझॉनच्या गुंतवणूकीच्या इन्स्टॉमिकच्या भागामुळे नुकतीच एक उत्कृष्ट बुद्धिमत्ता अपग्रेड झाली आहे.
आता अलेक्साला नवीन Amazon मेझॉन व्हॉईस एआयसाठी जागा उपलब्ध करुन द्यावी लागेल: आज अॅमेझॉन नोव्हा सोनिक, तिसर्या -पक्षाच्या अनुप्रयोग विकसकांना नैसर्गिक ऑडिओ ऑडिओ तयार करण्यास आणि Amazon मेझॉनच्या इंटरनेटचा आधार वापरून त्याच्या उत्पादनांमध्ये रूपांतरित करण्यासाठी डिझाइन केलेले एक नवीन मॉडेल.
हे आता ड्युअल -डायरेक्शनल application प्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआय) द्वारे उपलब्ध आहे. खरं तर, Amazon मेझॉनने यापूर्वीच त्याचे काही भाग एकत्र केले आहेत – भाषणाचे शब्द जे प्रतिनिधित्व आणि भाषणाचे वितरक प्रदान करतात – नवीन अलेक्सा मॉडेल, अलेक्सा+मध्ये.
“हा दृष्टिकोन आम्हाला आमच्या भाषण तंत्रज्ञानाचे फायदे एकाच वेळी वापरण्याच्या वेगवेगळ्या प्रकरणांना प्रदान करण्यास अनुमती देते जेव्हा ग्राहकांच्या नोट्स आणि तांत्रिक प्रगतीवर आधारित दोन्ही प्रणाली विकसित करणे सुरू ठेवते,” त्यांनी आम्हाला त्याच्या नावासाठी प्रवक्ते सांगितले.
ग्राहक वापर प्रकरणांमध्ये ग्राहक समर्थन आणि सेवा, मार्गदर्शन, माहिती पुनर्प्राप्ती आणि करमणूक समाविष्ट आहे.
एकसमान
नोव्हा सोनिक व्हॉईस एआय मधील एक मोठे आव्हान आहे: तंत्रज्ञानाचे विभाजन.
पारंपारिकपणे, ध्वनी दर्शनी बांधकाम करण्यासाठी भाषण ओळख, भाषा प्रक्रिया आणि भाषण संश्लेषणासाठी स्वतंत्र मॉडेल एकत्रित करणे आवश्यक आहे, रोहित प्रसाद, एसव्हीपी आणि Amazon मेझॉनमधील एजीआय मधील मुख्य शास्त्रज्ञांच्या मते काल Amazon मेझॉन व्हिडिओ सेवेचा वापर करून व्हेंचरबिटसह व्हिडिओ कॉलमध्ये.
या जटिलतेमुळे बर्याचदा रोबोटिक आणि अनैसर्गिक प्रतिक्रिया मिळतात आणि विकासाचा सामान्य खर्च वाढतो.
आता, सोनिक एकामध्ये तीनही भिन्न मॉडेल्स एकत्रित करून ही स्थिती सुधारण्याचा प्रयत्न करीत आहे.
“नोव्हा सोनिकाने मजकूराच्या मजकूरापासून मजकूर समजून, मजकूर समजून घेतल्या आणि मजकूरापासून एक युनिफाइड सिस्टमला मजकूर समजून घेतल्या गेलेल्या तीन पारंपारिक स्वतंत्र मॉडेल्स एकत्रित केल्या ज्या केवळ” काय “नव्हे तर” कसे “संप्रेषण देखील डिझाइन करू शकतात.
ऑडिओ संदर्भ राखून – जसे टोन, लय आणि शैली – नोव्हा सोनिक मानवी संभाषणात बारीक बारीकसारीक टिकवून ठेवण्यास मदत करते.
दोन दिशानिर्देशांमध्ये व्हॉईस टॉकच्या गुंतागुंत आणि डॉज जाणून घ्या
नोव्हा सोनिक क्षमतांपैकी एक म्हणजे दोन -मार्ग थेट संभाषणांचा सामना करण्याची क्षमता. जेव्हा वापरकर्ते मानवी भाषणात थांबतात, संकोच करतात किंवा वागणुकीवर बहिष्कार घालतात हे त्याला कळते – आणि संदर्भ राखण्यासाठी द्रव प्रतिसाद द्या.
“येथे वास्तविक प्रवेश करणे म्हणजे वास्तविक बोलका संवाद आणि कमी संवाद, ज्याचा अर्थ असा आहे की आपण वाक्याच्या मध्यभागी कृत्रिम बुद्धिमत्तेवर बहिष्कार घालू शकता आणि संदर्भ कायम ठेवत राहू आणि सुसंगत मार्गाने प्रतिसाद देऊ.” हे वैशिष्ट्य विशेषत: ग्राहक सेवेसारख्या परिदृश्यांशी संबंधित आहे, जेथे प्रतिसाद आणि परिस्थितीशी जुळवून घेण्याची क्षमता खूप महत्वाची आहे.
नोव्हा सोनिक देखील इतर प्रणालींसह सहजतेने समाकलित करण्यासाठी डिझाइन केलेले आहे. हे स्वयंचलितपणे स्पोकन इनपुटमधून मजकूर तयार करते, ज्याचा उपयोग अनुप्रयोग किंवा मालकीच्या साधनांसह संवाद हलविण्यासाठी केला जाऊ शकतो. हे कंपन्यांना कृत्रिम बुद्धिमत्ता एजंट तयार करण्यास अनुमती देते जे नियुक्ती आरक्षित करणे, थेट माहिती पुनर्प्राप्त करणे किंवा जटिल ग्राहकांच्या चौकशीस प्रतिसाद देऊ शकतात.
“आपण Amazon मेझॉन बेड्रॉकद्वारे नोव्हा सोनिक वापरू शकता आणि कोणत्याही विशेष साधने किंवा स्त्रोतांशी, अगदी व्हिज्युअल स्रोतांशी जोडू शकता, जोपर्यंत ते संप्रेषण अनुप्रयोग प्रोग्रामिंगच्या दर्शनी भागाच्या श्लोकांप्रमाणे लपेटले जातात,” ब्राझाद म्हणाले. ही लवचिकता मॉडेलला शिक्षण आणि प्रवासापासून संस्था आणि करमणूक प्रक्रियेपर्यंत विस्तृत उद्योगांसाठी योग्य बनवते.
मानक कामगिरी आणि उद्योग तुलना
ओपनई कडून जीपीटी -4 ओ आणि गूगलच्या मिथुन फ्लॅश 2.0 मधील नोव्हा सोनिक वास्तविक वेळेत इतर ऑडिओ मॉडेलसह रेकॉर्ड केले गेले. इव्हल संयुक्त डेटा संकलनावर, जेमिनी फ्लॅश २.० वर .7 .7 ..7 % विजय दराने औपचारिक आवाजाचा वापर करून वैयक्तिक अमेरिकन संभाषणांसाठी जीपीटी -4 ओ वर .0१.० % विजय दर मिळविला. मानवी आणि ब्रिटिश आवाजानेही असेच नफा दिसून आले.
“नोव्हा सोनिक सध्या इंग्रजी आणि ब्रिटीश भाषेतील त्याच्या वर्गातील सर्वोत्कृष्ट आहे, कारण जीपीटी -4 ओला निसर्ग संभाषण आणि अचूकता या दोहोंमध्ये वास्तविक काळात आहे.” ते पुढे म्हणाले: “आमच्या माहितीनुसार, जीपीटी -4 ओ आणि जीपीटी -4 ओ मिनी-एर चे चल केवळ दोन इतर मॉडेल्स नोव्हा सोनिक भाषण आणि त्याची पिढी रिअल टाइममध्ये एकत्रित करण्यासाठी काय करीत आहेत. ही जागा अजूनही लवकर आणि कठीण आहे.”
एकाधिक क्षमता आणि गोंगाट वातावरणाशी व्यवहार करणे
भाषण ओळखताना, नोव्हा सोनिक देखील बहु -भाषेतील आणि वास्तववादी परिस्थितीत उत्कृष्ट आहे. इंग्रजी, फ्रेंच, जर्मन, इटालियन आणि स्पॅनिशच्या माध्यमातून जीपीटी -4 ओला 36 % पेक्षा जास्त वाढविणा Multi ्या बहु-भाषेच्या लिब्रिस्पेक स्टँडर्डवर वेर वर्ड एरर रेट (डब्ल्यूईआर) 2.२ % होता. बहु-बोलणार्या गोंगाट वातावरणात (एएमआय मानकांचा वापर करून मोजले जाते), नोव्हा सोनिकने जीपीटी -4 ओ आवृत्तीमध्ये 46.7 % सुधारणा दर्शविली.
अर्थपूर्ण आवाज आणि भाषेचा विस्तार
सध्या, मॉडेल अमेरिकन आणि ब्रिटीश इंग्रजीमध्ये पुरुष आणि महिला दोन्ही एकाधिक अभिव्यक्तीच्या ध्वनींचे समर्थन करते. Amazon मेझॉनने नमूद केले की अतिरिक्त बोलीभाषा आणि भाषा विकसित होत आहेत आणि भविष्यातील अद्यतनांमध्ये ती सोडली जातील.
संस्थेच्या प्रकल्पांची कमी किंमत
वेग आणि किंमत देखील अपीलचा एक भाग आहे. तृतीय पक्षाच्या पवित्रतेत अशी ऑफर देण्यात आली आहे की नोव्हा सोनिकचा ग्राहक यांच्यात १.० seconds सेकंदात एक ज्ञात वेळ आहे, तर ओपनई जीपीटी -4 ओ साठी १.१18 सेकंद आणि गूगल मिथुन फ्लॅश २.० साठी १.41१ सेकंद आहेत.
किंमतींच्या दृष्टिकोनातून, Amazon मेझॉन नोव्हा सोनिक संस्थांसाठी तयार -तयार समाधान ठेवते. ब्राझाद म्हणाले, “आम्ही जीपीटी -4 ओपेक्षा जवळजवळ % ० % स्वस्त आहोत. “
क्षेत्रांद्वारे लवकर दत्तक घेणे
Amazon मेझॉनच्या म्हणण्यानुसार, विविध क्षेत्रातील कंपन्यांनी नोव्हा सोनिकचा वापर किंवा चाचणी सुरू केली आहे.
एएसएपीपी कार्यबल रहदारी कार्ये सुधारण्यासाठी तंत्रज्ञान लागू करते, अचूकता आणि नैसर्गिक संवादाच्या प्रक्रियेचे कौतुक करते.
एज्युकेशन फर्स्ट (ईएफ) वास्तविक उच्चारण नोट्स असलेल्या भाषा शिकणार्यांना समर्थन देण्यासाठी मॉडेलचा वापर करते, विशेषत: विविध अॅक्सेंट नसलेल्या -इंडिजिनल स्पीकर्ससाठी.
क्रीडा डेटा पुरवठा आकडेवारी कमी नोव्हा सोनिक ट्रान्समिशन वेळ आणि त्यांच्या ओपीटीए एआय चॅट प्लॅटफॉर्मवर वेगवान डेटा प्रतिक्रिया चालविण्यासाठी सोपी तयारी करतात.
कृत्रिम बुद्धिमत्ता आणि सुरक्षा वचनबद्धतेची जबाबदारी
कामगिरी आणि खर्चाव्यतिरिक्त, Amazon मेझॉन एआय जबाबदार एआयच्या विकासासाठी आपली वचनबद्धता अधोरेखित करते. मॉडेल्सच्या नोव्हा कुटुंबात कॉम्पॅक्ट हमी समाविष्ट आहे आणि एडब्ल्यूएस एआय सर्व्हिस कार्डद्वारे समर्थित आहे जे इच्छित वापर प्रकरणे, संभाव्य निर्बंध आणि नैतिक मार्गदर्शक तत्त्वे निर्धारित करतात.
ब्राझादने Amazon मेझॉनच्या आत्मविश्वास आणि सुरक्षिततेवर लक्ष केंद्रित केले: “विश्वास आमच्यासाठी महत्त्वपूर्ण आहे – विकसक हद्दीत व्यक्तिमत्त्वाचे वाटप करू शकतात, परंतु अवांछित आवाज किंवा अनुकरण क्लोनिंग रोखण्यासाठी आम्ही मजबूत हँडरेलमध्ये ठेवले आहे.” ते पुढे म्हणाले: “आम्ही भ्रम आणि व्हॉईस ड्राफ्ट काढून टाकण्यासाठी कठोर परिश्रम करीत आहोत. आम्ही रिलीझसाठी ओळखलेली टेप उच्च आहे कारण भाषणाची पिढी विश्वासार्ह असणे आवश्यक आहे.”
Amazon मेझॉन नोव्हा सोनिक सामान्यत: Amazon मेझॉन बेड्रॉकद्वारे उपलब्ध असतो. मॉडेल एक्सप्लोर करण्यात स्वारस्य विकसक आणि संस्था https://aws.amazon.com/nova/ वर भेट देऊन प्रारंभ करू शकतात.
Source link