उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


जरी मोठ्या भाषेची मॉडेल्स आणि तर्कशास्त्र सामान्य राहिले आहे, तरीही संस्था उर्जा आणि खर्चाच्या कमी चिंतेसह कृत्रिम बुद्धिमत्ता चालविण्यासाठी लहान मॉडेलकडे जात आहेत.

काही संस्था छोट्या आवृत्त्यांसाठी मोठ्या मॉडेल्सद्वारे डिस्टिल्ड केल्या जातात, परंतु नियंत्रक आवडतात गूगल एलएलएमएस मॉडेल्सचा पर्याय म्हणून लहान भाषा मॉडेल (एसएलएम) जारी करणे सुरू ठेवा, ज्याची कार्यक्षमता किंवा अचूकतेचा बळी न देता ऑपरेट करण्यासाठी अधिक खर्च होऊ शकेल.

हे लक्षात घेऊन, Google ने त्याची नवीनतम लहान -शैली आवृत्ती, जेम्मा सोडली, ज्यात विस्तारित विंडोज, मोठे पॅरामीटर्स आणि मल्टी -मेडिया विचार करण्याची क्षमता आहे.

जेम्मा 3, ज्यात मोठ्या गीनी 2.0 मॉडेल्ससारखीच प्रक्रिया शक्ती आहे, फोन आणि लॅपटॉप सारख्या लहान उपकरणांद्वारे अधिक चांगले वापरले जाते. नवीन मॉडेलचे चार आकार आहेत: 1 बी, 4 बी, 12 बी आणि 27 बी.

128 किलोमीटरच्या मोठ्या संदर्भ विंडोसह – त्या उलट, जेम्मा 2 मध्ये 80 के – जीएमएमए 3 ची संदर्भ विंडो होती – आपण अधिक माहिती आणि जटिल विनंत्या समजू शकता. Google ने 140 भाषांमध्ये कार्य करण्यासाठी, प्रतिमा, मजकूर, लहान व्हिडिओ आणि कार्ये ऑटोमेशनसाठी समर्थन आणि पालकांच्या प्रगतीसाठी समर्थनाचे विश्लेषण करण्यासाठी जेम्मा 3 अद्यतनित केले आहे.

जेम्मा एक मजबूत कामगिरी देते

संगणकीय खर्च आणखी कमी करण्यासाठी, Google ने जीईएमएमएची परिमाणात्मक आवृत्ती प्रदान केली आहे. विचार करणे परिमाणात्मक मॉडेल संकुचित मॉडेल म्हणून. हे अचूकतेचा बलिदान न देता “मॉडेलच्या वजनात संख्यात्मक मूल्यांची अचूकता कमी करण्याच्या प्रक्रियेद्वारे उद्भवते.

गूगलने म्हटले आहे की जेम्मा 3 “त्याच्या आकारासाठी नवीनतम कामगिरी ऑफर करते” आणि एलएलएमए -405 बी, दीपसीक-व्ही 3 आणि ओ 3-मिनी सारख्या एलएलएमएस आउटफॉर्मर्ड एलएलएम. जेम्मा 3 2 2 बी, विशेषत: चॅटबॉट अरेना एलो चाचण्यांमध्ये दीपसीक-आर 1 ते दुसर्‍या क्रमांकावर आहे. ते अव्वल होते Dibsicलहान मॉडेल, डायबसिक व्ही 3, ओपनईएस ओ 3-मिनी, मृतचे लामा -405 बी आणि चूक मोठे.

जेएमएमए 3 ची रक्कम निवडून, वापरकर्ते कार्यक्षमता सुधारू शकतात, फॉर्म चालवू शकतात आणि अनुप्रयोग तयार करू शकतात “जीपीयू प्रोसेसिंग युनिट आणि टेन्शनर ट्रीटमेंट युनिट (टीपीयू) च्या होस्टला अनुकूल करू शकतात.”

जेम्मा 3 विकसकांच्या साधनांसह समाकलित आहे जसे की लगिंग फेस ट्रान्सफॉर्मर्स, ओल्लामा, जॅक्स, केरास, पायटोरच आणि इतर. वापरकर्ते Google एआय स्टुडिओ, मिठी मारणारा चेहरा किंवा कागेद्वारे जेम्मा 3 मध्ये प्रवेश करू शकतात. कॉर्पोरेट्स आणि विकसक एआय स्टुडिओद्वारे जेम्मा 3 एपीआयमध्ये प्रवेश करण्याची विनंती करू शकतात.

सुरक्षेसाठी गिमा शिल्ड

गूगल म्हणाली की तिने जेम्मा 3 मध्ये सेफ्टी प्रोटोकॉल तयार केले आहेत, ज्यात शिल्डगेमा 2 नावाच्या सेफ्टी ऑडिटरचा समावेश आहे.

“जेएमएमए 3 चा विकास विस्तृत डेटा गव्हर्नन्सची हमी देतो, मानक मूल्यांकन आणि मजबूत मोजमापांद्वारे आमच्या सुरक्षा धोरणांशी सुसंगतता,” Google ब्लॉग पोस्टमध्ये लिहिलेले आहे. “असे करण्याच्या सर्वात कमी क्षमतेच्या आमच्या मूल्यांकनाची नोंद करण्यास अधिक सक्षम मॉडेल्सची सर्वसमावेशक चाचणी असताना, एसटीईएमच्या वाढलेल्या जीएमएमए 3 कामगिरीमुळे विशिष्ट मूल्यांकन केले गेले जे हानिकारक पदार्थ तयार करण्याच्या गैरवापराच्या संभाव्यतेवर लक्ष केंद्रित करते; त्याचे परिणाम कमी जोखीम दर्शवितात.”

शिल्डगेमा 2 एक 4 बी फोटो ऑडिटर आहे, जेम्मा 3 फाउंडेशनवर आधारित एक पॅरामीटर आहे. वापरकर्ते त्यांच्या स्वत: च्या गरजा भागविण्यासाठी शिल्डगेमा 2 सानुकूलित करू शकतात.

लहान मॉडेल्स आणि ओव्हरफ्लो

गूगलला प्रथम फेब्रुवारी 2024 मध्ये रिलीज झाल्यापासून, एसएलएमएसने व्याजात वाढ केली आहे. मायक्रोसॉफ्ट पीएचआय -4 आणि मिस्ट्रल स्मॉल 3 सारख्या इतर छोट्या मॉडेल्सवरून असे दिसून येते की संस्था एलएलएम सारख्या मजबूत मॉडेलसह अनुप्रयोग तयार करू इच्छित आहेत, परंतु एलएलएम काय करू शकतात याची श्रेणी वापरू शकत नाही.

आपण डिस्टिलेशनद्वारे पसंत करता अशा एलएलएमच्या छोट्या आवृत्त्यांमध्ये संस्थांनी बदलण्यास सुरवात केली आहे. स्पष्ट होण्यासाठी, जेम्मा हे मिथुन 2.0 चे ऊर्धपातन नाही; त्याऐवजी, त्याच डेटा आणि आर्किटेक्चरच्या समान संचासह प्रशिक्षण दिले आहे. डिस्टिल्ड मॉडेल मोठ्या मॉडेलमधून शिकते, जे रत्न आहे.

मॉडेलसाठी नियुक्त केलेल्या वापराच्या प्रकरणांना अनुकूल असलेल्या संस्थांना बर्‍याचदा प्राधान्य दिले जाते. ओ 3-मिनी किंवा क्लॉड 7.7 सारख्या एलएलएम प्रकाशित करण्याऐवजी एक साध्या प्रतीक संपादकावर सॉनेट, एक लहान मॉडेल, एसएलएम किंवा डिस्टिल्ड आवृत्ती असो, ही कार्ये मोठ्या मॉडेलला मागे टाकल्याशिवाय सहजपणे करू शकतात.


Source link