मिथुन 3 अजूनही आवाज करत असताना, Google ने नवीन मॉडेल लाँच करण्यापासून मागे हटले नाही.
काल, कंपनीने FunctionGemma जारी केले, एक विशेष 270 दशलक्ष-पॅरामीटर AI मॉडेल आधुनिक ऍप्लिकेशन डेव्हलपमेंटमधील सर्वात चिकाटीच्या अडथळ्यांपैकी एक सोडवण्यासाठी डिझाइन केलेले आहे: काठावरची विश्वसनीयता.
सामान्य-उद्देशीय चॅटबॉट्सच्या विपरीत, फंक्शनजेम्मा एका महत्त्वाच्या उपयुक्ततेसाठी डिझाइन केलेले आहे: वापरकर्त्याच्या नैसर्गिक भाषेतील आदेशांचे संरचित कोडमध्ये भाषांतर करणे जे ॲप्स आणि डिव्हाइसेस प्रत्यक्षात कार्यान्वित करू शकतात, हे सर्व क्लाउडशी कनेक्ट न करता.
रिलीझ Google DeepMind आणि Google AI डेव्हलपर्स टीमसाठी एक महत्त्वपूर्ण धोरणात्मक पिव्होट दर्शवते. उद्योग क्लाउडमध्ये ट्रिलियन-पॅरामीटर स्केलचा पाठलाग करत असल्याने, फंक्शनजेम्मा त्यावर पैज लावत आहे "लहान भाषा मॉडेल" (SLM) जे फोन, ब्राउझर आणि IoT डिव्हाइसेसवर मूळपणे चालते.
AI वास्तुविशारद आणि एंटरप्राइझ बिल्डर्ससाठी, हे मॉडेल नवीन आर्किटेक्चरल आदिम: गोपनीयता प्रथम सादर करते "राउटर" हे उपकरणावरील जटिल तर्कशास्त्र थोड्या विलंबाने हाताळू शकते.
Gemma चे पोस्ट Hugging Face आणि Kaggle वर डाउनलोड करण्यासाठी त्वरित उपलब्ध आहे. तुम्ही Google Play Store वर Google AI Edge Gallery ॲप डाउनलोड करून मॉडेलला कृतीतही पाहू शकता.
कामगिरीची झेप
त्याच्या मुळाशी, ते फंक्शनजेमाशी संबंधित आहे "अंमलबजावणी अंतर" जनरेटिव्ह आर्टिफिशियल इंटेलिजन्समध्ये. स्टँडर्ड लार्ज लँग्वेज मॉडेल्स (LLM) संभाषणासाठी उत्कृष्ट आहेत परंतु बऱ्याचदा सॉफ्टवेअर दिनचर्या विश्वसनीयरित्या चालविण्यात अडचण येते – विशेषत: संसाधन-प्रतिबंधित हार्डवेअरवर.
गुगल इंटर्नल्सनुसार "मोबाइल क्रिया" मूल्यमापन,सामान्य लहान मॉडेलला विश्वासार्हतेचा त्रास होतो, फंक्शन कॉल,टास्कसाठी केवळ 58% बेसलाइन अचूकता प्राप्त होते. तथापि, एकदा या विशिष्ट उद्देशासाठी बारीक-ट्यून केल्यावर, फंक्शनजेम्माची अचूकता 85% वर पोहोचली, एक विशेष मॉडेल तयार केले जे मॉडेलच्या आकारापेक्षा कितीतरी पटीने समान यश दर दर्शवू शकते.
हे मॉडेलला साध्या ऑन/ऑफ स्विचपेक्षा अधिक हाताळण्यास अनुमती देते; हे जटिल माध्यमांचे विश्लेषण करू शकते, जसे की गेम मेकॅनिक्स किंवा तपशीलवार तर्कांचे मार्गदर्शन करण्यासाठी विशिष्ट ग्रिड निर्देशांक निर्धारित करणे.
रिलीझमध्ये फक्त मॉडेल वजनापेक्षा अधिक समाविष्ट आहे. Google पूर्ण ऑफर देते "कृती" विकासकांसाठी, यासह:
-
मॉडेल: 270M पॅरामीटर ट्रान्सफॉर्मर 6 ट्रिलियन कोडवर प्रशिक्षित.
-
प्रशिक्षण डेटा: a "मोबाइल क्रिया" डेव्हलपरला त्यांच्या एजंटला प्रशिक्षित करण्यात मदत करणारा डेटासेट.
-
इकोसिस्टम सपोर्ट: हगिंग फेस ट्रान्सफॉर्मर्स, केरा, अनस्लॉथ आणि NVIDIA NeMo लायब्ररीसह सुसंगतता.
ओमर सॅनसेवेरो, हगिंग फेसचे विकासक अनुभव प्रमुख, यांनी X (पूर्वीचे ट्विटर) वरील आवृत्तीच्या अष्टपैलुत्वावर प्रकाश टाकला, हे लक्षात घेऊन मॉडेल "तुमच्या कार्यांसाठी खास बनवण्यासाठी डिझाइन केलेले" ते ऑपरेट करता येते "तुमचा फोन, ब्राउझर किंवा इतर उपकरणे."
हा स्थानिक-प्रथम दृष्टिकोन तीन वेगळे फायदे देतो:
-
गोपनीयता: वैयक्तिक डेटा (जसे की कॅलेंडर नोंदी किंवा संपर्क) कधीही डिव्हाइस सोडत नाही.
-
लेटन्सी: सर्व्हरची वाट न पाहता क्रिया त्वरित होतात. लहान आकाराचा अर्थ असा आहे की ते इनपुटवर प्रक्रिया करत असलेली गती जास्त आहे. विशेषत: GPU आणि NPU सारख्या प्रवेगकांच्या प्रवेशासह.
-
किंमत: विकसक साध्या परस्परसंवादासाठी प्रति टोकन API फी भरत नाहीत.
एआय बिल्डर्ससाठी: उत्पादन कार्यप्रवाहाची एक नवीन शैली
एंटरप्राइझ डेव्हलपर आणि सिस्टम इंजिनीअर्ससाठी, फंक्शनजेम्मा मोनोलिथिक एआय सिस्टम्सपासून दूर जटिल सिस्टमकडे जाण्याचे सुचवते. GPT-4 किंवा जेमिनी 1.5 प्रो सारख्या मोठ्या, महागड्या क्लाउड मॉडेलवर प्रत्येक साध्या वापरकर्त्याच्या विनंतीला रूट करण्याऐवजी, निर्माते आता फंक्शनजेमा एक बुद्धिमान सॉफ्टवेअर म्हणून तैनात करू शकतात. "रहदारी मॉनिटर" काठावर.
उत्पादनात फंक्शनजेमा वापरून एआय निर्माते कशी कल्पना करतात ते येथे आहे:
1. नाही "रहदारी मॉनिटर" बिल्ड: उत्पादन वातावरणात, FunctionGemma तुमच्या संरक्षणाची पहिली ओळ म्हणून काम करू शकते. हे वापरकर्त्याच्या डिव्हाइसवर असते आणि सामान्य, उच्च-वारंवारता आदेश (नेव्हिगेशन, मीडिया नियंत्रण, मूलभूत डेटा एंट्री) त्वरित हाताळते. विनंतीसाठी खोल विचार किंवा जागतिक ज्ञान आवश्यक असल्यास, मॉडेल ती गरज ओळखू शकते आणि विनंती मोठ्या क्लाउड मॉडेलकडे पाठवू शकते. हा संकरित दृष्टीकोन क्लाउड अनुमान खर्च आणि विलंबता लक्षणीयरीत्या कमी करतो. हे योग्य उप-एजंटकडे क्वेरी राउटिंग सारखी प्रकरणे वापरण्यास सक्षम करते.
2. सर्जनशील अराजकतेवर निर्धारवादी विश्वासार्हता: संस्थांना क्वचितच त्यांचे स्वतःचे बँकिंग किंवा कॅलेंडर ॲप्स असणे आवश्यक आहे "सर्जनशील" ते अचूक असणे आवश्यक आहे. 85% अचूकतेची उडी स्पेशलायझेशन ट्रंप आकाराची पुष्टी करते. या छोट्या मॉडेलला डोमेन-विशिष्ट डेटा (उदा. एंटरप्राइझ APIs) वर फाईन-ट्यूनिंग केल्याने एक अत्यंत विश्वासार्ह साधन तयार होते जे अंदाजानुसार कार्य करते – उत्पादन उपयोजनासाठी आवश्यक.
3. प्रथम गोपनीयतेची वचनबद्धता: हेल्थकेअर, फायनान्स किंवा सुरक्षित एंटरप्राइझ ऑपरेशन्स सारख्या क्षेत्रांसाठी, क्लाउडवर डेटा पाठवणे सहसा अनुपालन धोका दर्शवते. कारण FunctionGemma ऑन-डिव्हाइस चालविण्यासाठी पुरेसे कार्यक्षम आहे (NVIDIA Jetson, मोबाइल CPUs आणि ब्राउझर-आधारित Transformers.js सह सुसंगत), संवेदनशील डेटा जसे की वैयक्तिकरित्या ओळखण्यायोग्य माहिती (PII) किंवा मालकी आदेशांना कधीही स्थानिक नेटवर्क सोडावे लागत नाही.
परवाना: हँडरेल्ससह उघडा
FunctionGemma Google च्या सानुकूल Gemma वापर अटींनुसार रिलीझ केले आहे. एंटरप्राइझ आणि व्यावसायिक विकासकांसाठी, हे MIT किंवा Apache 2.0 सारख्या स्टँडर्ड ओपन सोर्स परवान्यांपेक्षा एक महत्त्वपूर्ण फरक आहे.
Google जेमाचे वर्णन करत असताना "खुला फॉर्म," तंतोतंत नाही "मुक्त स्रोत" ओपन सोर्स इनिशिएटिव्ह (OSI) द्वारे परिभाषित केल्याप्रमाणे.
परवाना विनामूल्य व्यावसायिक वापर, पुनर्वितरण आणि सुधारणांना परवानगी देतो, परंतु विशिष्ट वापर प्रतिबंध समाविष्ट करतो. विकासकांना प्रतिबंधित क्रियाकलापांसाठी (जसे की द्वेषयुक्त भाषण किंवा मालवेअर तयार करणे) फॉर्म वापरण्यास मनाई आहे आणि Google या अटी अपडेट करण्याचा अधिकार राखून ठेवते.
बहुसंख्य स्टार्टअप आणि विकासकांसाठी, व्यावसायिक उत्पादने तयार करण्यासाठी परवाना देणे पुरेसे आहे. तथापि, जे संघ दुहेरी-वापर तंत्रज्ञान तयार करतात किंवा ज्यांना कठोर कॉपीलेफ्ट स्वातंत्र्य आवश्यक आहे त्यांनी संबंधित विशिष्ट कलमांचे पुनरावलोकन केले पाहिजे "हानिकारक वापर" आणि विशेषता.
















