उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


Google “एआय ग्लोबल असिस्टंट” च्या उद्दीष्टाच्या जवळ आहे, जे संदर्भ, नियोजन आणि उपाययोजना समजू शकते.

आज Google I/O मध्ये, टेक जियानने मिथुन 2.5 फ्लॅशमध्ये आपल्या सुधारणांची घोषणा केली आहे – विचार, प्रतीक आणि लांब संदर्भ – आणि 2.5 प्रो, प्रायोगिक वर्धित विचार मोडसह “हे जवळजवळ प्रत्येक परिमाण जवळजवळ चांगले आहे,” प्रतिसाद देण्यापूर्वी व्यावसायिकांना एकाधिक गृहीतकांचा विचार करण्यास अनुमती देते.

“मिथुन अनुप्रयोगाचे हे आमचे अंतिम लक्ष्य आहे: अ‍ॅम्नेस्टी इंटरनॅशनल, जे एक व्यक्तिमत्त्व आहे, पूर्व -सामर्थ्यवान आणि मजबूत आहे,” गूगल डीपमिंडचे मुख्य कार्यकारी अधिकारी दिमिस हॅसबिस यांनी सांगितले.

“खोल विचार” उच्च मानकांमध्ये प्रभावी आहे

गूगलने मार्चमध्ये कोट्यावधी लाखोंच्या विंडोसह, आतापर्यंत त्याच्या सर्वात बुद्धिमान मॉडेल्सचा विचार केला आहे.

“ग्राफिक्सला परस्परसंवादी अनुप्रयोगांमध्ये रूपांतरित करण्यापासून संपूर्ण शहरांचे अनुकरण करण्यापर्यंत लोकांनी तयार केलेल्या लोकांवर खरोखरच परिणाम होतो.”

अल्फाओच्या Google अनुभवाच्या आधारे त्यांनी असे निदर्शनास आणून दिले की कृत्रिम बुद्धिमत्ता मॉडेल प्रतिक्रिया देताना सुधारतात विचार करण्यासाठी अधिक वेळ. यामुळे डीपमाइंड वैज्ञानिकांनी डीप थिंक विकसित केले, जे Google मधील समांतर तंत्रासह विचार करण्यासाठी आणि विचार करण्यासाठी नवीनतम प्रगत संशोधनाचा वापर करते.

डीप थिंकने उसामो ऑलिम्पिकसह जास्तीत जास्त गणित आणि कोडिंग मानकांवर प्रभावी अंश दर्शविले. हे लाइव्हकोडबेंच देखील होते, जे स्पर्धेच्या पातळीवर कोडिंगचे एक कठीण मानक आहे आणि एमएमएमयूवर 84.0 % रेकॉर्ड करते, जे मल्टीमीडिया समज आणि विचारांची चाचणी घेते.

“आम्ही अधिक सीमा सुरक्षा मूल्यांकन करण्यासाठी आणि सुरक्षा तज्ञांकडून अधिक माहिती मिळविण्यासाठी काही अतिरिक्त वेळ घेतो,” हसाबिस पुढे म्हणाले. (अर्थ: आणि सध्याच्या वेळी, क्षमता व्यापकपणे उपलब्ध होण्यापूर्वी अभिप्रायासाठी ट्रस्टेड लॅबोरेटरीज इंटरफेस प्रोग्रामिंग इंटरफेसद्वारे उपलब्ध आहेत.)

सर्वसाधारणपणे, नवीन ए 25 प्रो प्रो प्रॉजिनबोर्ड वेबडे एरेना लीड करते, एलो-डिग्रीसह जे बुद्धिबळ 1420 (इंटरमीडिएट ते कार्यक्षमता) सारख्या खेळाडूंच्या खेळांमधील खेळाडूंच्या खेळांसाठी सापेक्ष कौशल्याची पातळी मोजते. हे लॅमेरेना लीडरबोर्डच्या सर्व श्रेणींमध्ये देखील नेतृत्व करते, जे मानवी पसंतीच्या आधारे कृत्रिम बुद्धिमत्तेचे मूल्यांकन करते.

हसाबिस म्हणाले, “ग्राफिक्सला परस्परसंवादी अनुप्रयोगांमध्ये रूपांतरित करण्यापासून संपूर्ण शहरांचे अनुकरण करण्यापासून (वापरकर्त्यांनी) जे तयार केले त्यावरून आम्हाला खरोखर परिणाम झाला आहे,” हसाबिस म्हणाले.

मिथुन 2.5 प्रो, फ्लॅशसाठी महत्त्वपूर्ण अद्यतने

आज, Google ने सुधारित 2.5 फ्लॅशची घोषणा केली आहे, वेग, कार्यक्षमता आणि कमी किंमतीसाठी डिझाइन केलेले काम एक मॉडेल आहे. विचार, प्रतीक, प्रतीक आणि लांब संदर्भ या निकषात सर्व क्षेत्रात 2.5 फ्लॅश सुधारला गेला आहे – हसाबिसने असे सूचित केले की ते एलएमआरएनए पॅनेलवरील “फक्त द्वितीय” ते 2.5 प्रो आहे. 20 ते 30 % विशिष्ट प्रतीकांचा वापर करून मॉडेल देखील अधिक कार्यक्षम आहे.

Google विकसकाच्या नोट्सच्या आधारे 2.5 फ्लॅशमध्ये अंतिम समायोजन करते; हे आता Google एआय स्टुडिओ आणि व्हर्टेक्स एआय आणि मिथुन अ‍ॅपमध्ये तपासणीसाठी उपलब्ध आहे. हे सामान्यत: जूनच्या सुरुवातीस उत्पादनासाठी उपलब्ध असेल.

अधिक नैसर्गिक संभाषणाचे अनुभव तयार करण्यासाठी मूळ ध्वनी आउटपुट करणे, अनेक स्पीकर्सना समर्थन देण्याची योजना, सारांश आणि विचारांचे बजेट.

मूळ ध्वनीच्या अंतर्भूततेसह (तपासणीत), वापरकर्ते मिथुन टोन, त्याची नाडी आणि बोलण्याची शैली निर्देशित करू शकतात (विचार करा: कथा सांगताना मॉडेलला मायक्रोरामी किंवा मॉडेलिनचे निर्देशित करणे). प्रोजेक्ट मारिनर प्रमाणेच मॉडेल देखील साधनांनी सुसज्ज आहे, ज्यामुळे ते वापरकर्त्यांच्या वतीने शोधण्याची परवानगी देतात.

इतर प्रारंभिक प्रायोगिक ध्वनी वैशिष्ट्यांमध्ये भावनिक संवाद समाविष्ट आहे, जे मॉडेलला वापरकर्त्याच्या आवाजामध्ये भावना शोधण्याची आणि योग्य प्रतिसाद देण्याची क्षमता देते; पूर्व -एम्प्टिव्ह ध्वनी जो पार्श्वभूमी संभाषणे समायोजित करण्यास अनुमती देतो; सर्वात जटिल कार्यांना समर्थन देण्यासाठी थेट अनुप्रयोग प्रोग्रामिंग इंटरफेसबद्दल विचार करणे.

प्रो आणि फ्लॅश या दोहोंमधील एकाधिक नवीन वैशिष्ट्ये 24 पेक्षा जास्त भाषांना समर्थन देतात आणि मॉडेल्स द्रुतपणे एका टोनमधून दुसर्‍या टोनकडे वळू शकतात. “भाषणाचा मजकूर अर्थपूर्ण आहे आणि व्हिस्पर सारख्या सूक्ष्म बारीकसारीक गोष्टींचा उपयोग करू शकतो,” असे गूगल डीपमाइंडचे सीटीओ कोरई कॅवोगोगूग्लू आणि आज प्रकाशित झालेल्या ब्लॉगमध्ये गुगल डीपमिंडचे पहिले संचालक तुल्से डोशी यांनी लिहिले.

शिवाय, 2.5 प्रो आणि फ्लॅशमध्ये आता एपीआय जेमिनी आणि व्हर्टेक्स एआय मधील विचारांचा सारांश समाविष्ट आहे. या “मॉडेलच्या कच्च्या कल्पनांना घ्या आणि हेड्स, मुख्य तपशील आणि विशिष्ट क्रियांविषयी माहिती, जसे की वापरल्या गेलेल्या साधनांसह स्पष्टपणे आयोजित करा”, कावुक्कुओग्लू आणि डोशी स्पष्ट करतात. मॉडेल विचार आणि वापरकर्त्यांना जेमिनीशी संवाद साधणे यासाठी अधिक संघटित आणि सरलीकरण स्वरूप प्रदान करण्याचे उद्दीष्ट आहे हे समजून घेणे आणि योग्य करणे सोपे आहे.

2.5 फ्लॅश प्रमाणेच, प्रो आता “थिंकिंग बजेट” ने सुसज्ज आहे, जे विकसकांना मॉडेल प्रतिसाद देण्यापूर्वी विचार करण्यासाठी वापरलेल्या प्रतीकांची संख्या नियंत्रित करण्याची क्षमता देते किंवा जर ते प्राधान्य देत असतील तर त्याच्या विचारांची पूर्णपणे क्षमता. ही क्षमता येत्या आठवड्यात सामान्यत: उपलब्ध असेल.

अखेरीस, Google ने जीमिनी अनुप्रयोग इंटरफेसमध्ये एमसीपी -कॉन्टेक्स्ट प्रोटोकॉल परिभाषांमध्ये मूळ एसडीके समर्थन जोडले जेणेकरून मॉडेल त्यांना मुक्त स्त्रोत साधनांसह अधिक सहजपणे विलीन करू शकतील.

हसन म्हणाले: “आम्ही इतिहासाच्या एका अद्भुत क्षणात जगतो कारण ते कृत्रिम बुद्धिमत्ता एक आश्चर्यकारक नवीन भविष्य बनवते. ते अस्वस्थ झाले आहे.”


Source link