हा लेख व्हेंचरबीटच्या विशेष संख्येचा एक भाग आहे, “अॅम्नेस्टी इंटरनेशनलची खरी किंमत: कामगिरी, कार्यक्षमता आणि मोठ्या प्रमाणात गुंतवणूक.” या विशेष क्रमांकाचे अधिक वाचा.
एलएलएमएस मॉडेल्सच्या (एलएलएमएस) देखाव्याने कंपन्यांना ते करू शकणार्या प्रकल्पांच्या प्रकारांची कल्पना करणे सुलभ केले आहे, ज्यामुळे आता प्रायोगिक कार्यक्रम प्रकाशित होतात.
तथापि, या प्रकल्पांना गती मिळाल्यामुळे संस्थांना हे समजले की त्यांनी वापरलेले मागील एलएलएम चुकीचे आणि त्यापेक्षा वाईट होते, महाग होते.
लहान भाषा मॉडेल आणि ऊर्धपातन प्रविष्ट करा. मायक्रोसॉफ्ट पीएचआय आणि मिस्ट्रल 1.१ कंपन्यांना कंपन्यांना विशिष्ट कार्यांसाठी कार्य करणारे वेगवान आणि अचूक मॉडेल निवडण्याची परवानगी आहे. संस्था विशिष्ट वापराच्या परिस्थितीसाठी एक लहान मॉडेल निवडू शकतात, ज्यामुळे त्यांना त्यांच्यासाठी कृत्रिम बुद्धिमत्ता अनुप्रयोगांची किंमत कमी करण्याची आणि गुंतवणूकीवर अधिक चांगले परतावा मिळू शकेल.
लिंक्डिन क्रॅटिक रामगोबल व्हेंचरबीटच्या विशिष्ट अभियंताने कंपन्यांना सांगितले आहे की कंपन्यांनी अनेक कारणांमुळे लहान मॉडेल निवडले आहेत.
“छोट्या मॉडेल्सना जीपीयू खर्च, उर्जा आवश्यकता आणि उर्जा आवश्यकतांमुळे थेट ओपेक्स लो इन्फ्रास्ट्रक्चर (ऑपरेटिंग खर्च) आणि कॅपेक्स (भांडवली खर्च) मध्ये थेट भाषांतर केले जाते,” रॅमगॅपएल म्हणाले, जीपीयू खर्च, उर्जा आवश्यकता आणि उर्जा आवश्यकतांमुळे थेट ओपेक्स लो इन्फ्रास्ट्रक्चर (ऑपरेटिंग खर्च) आणि कॅपेक्स (भांडवली खर्च) मध्ये थेट भाषांतर केले जाते. “मिशन मॉडेल्समध्ये एक संकुचित श्रेणी आहे, जी जटिल वेगवान अभियांत्रिकीशिवाय त्यांचे वर्तन अधिक सुसंगत आणि वेळोवेळी देखभाल करते.”
विकसक मॉडेल त्यानुसार त्यांच्या छोट्या मॉडेल्सची किंमत आहे. ओपनईच्या ओ 4-मिनीची किंमत इनपुटसाठी प्रति दशलक्ष कोड आणि आउटपुटसाठी 4 4.4/दशलक्ष प्रतीक आहे, संपूर्ण ओ 3 आवृत्तीच्या तुलनेत इनपुटसाठी 10 डॉलर आणि 40 डॉलर आउटपुटसाठी.
कॉर्पोरेट्समध्ये आज निवडण्यासाठी लहान मॉडेल्स, मिशन मॉडेल आणि डिस्टिल्ड मॉडेल्सची मोठी श्रेणी आहे. आजकाल, बहुतेक मुख्य मॉडेल आकारांचा संच देतात. उदाहरणार्थ, अँथ्रोपियर, क्लॉड ओबस, सर्वात मोठे मॉडेल, क्लॉड सॉनेट आणि मॉडेल क्लॉड हायकू या मॉडेलचे क्लॉड कुटुंब ही सर्वात छोटी प्रत आहे. हे मॉडेल लॅपटॉप किंवा मोबाइल फोन सारख्या मोबाइल डिव्हाइसवर कार्य करण्यासाठी पुरेसे संकुचित आहेत.
प्रश्न जतन करा
गुंतवणूकीवरील परताव्यावर चर्चा करताना, प्रश्न नेहमीच असतो: गुंतवणूकीवरील परतावा काय दिसतो? ते खर्च केलेल्या खर्चावर परत येत असावे किंवा वेळ वाचवावे ज्याचा शेवटी अर्थ असा आहे की डॉलर लाइनवर जतन केले गेले आहेत? व्हेंचरबिट येथील तज्ञांनी सांगितले की गुंतवणूकीवरील परतावा न्याय करणे कठीण आहे कारण काही कंपन्यांचा असा विश्वास आहे की त्यांनी एखाद्या मिशनवर खर्च केलेला वेळ कमी करून गुंतवणूकीवर परतावा मिळविला आहे, तर काहीजण वास्तविक डॉलर देण्याची प्रतीक्षा करीत आहेत किंवा कृत्रिम बुद्धिमत्ता गुंतवणूकीस आधीपासूनच यशस्वी झाले आहे की नाही यावर अधिक व्यवसाय सादर केला आहे.
सहसा, गुंतवणूकीला परत आलेल्या संस्था मुख्य तंत्रज्ञ तंत्रज्ञ रवी नरला यांनी पोस्टमध्ये दर्शविल्याप्रमाणे एका साध्या सूत्राद्वारे मोजल्या जातात: आरओआय = (खर्च लाभ)/खर्च. परंतु कृत्रिम बुद्धिमत्ता कार्यक्रमांसह, फायदे त्वरित स्पष्ट झाले नाहीत. ऐतिहासिक डेटाच्या आधारे त्यांनी मिळविलेले आणि कौतुक करण्याची अपेक्षा असलेल्या संस्थांना प्रस्तावित केले आहे आणि ते एम्नेस्टी इंटरनॅशनलच्या एकूण किंमतीबद्दल वास्तववादी आहेत, ज्यात नोकरी करणे, अंमलबजावणी करणे आणि देखरेख करणे आणि हे बरेच काळ असणे आवश्यक आहे हे समजून घेणे.
छोट्या मॉडेल्ससह, तज्ञांचा असा युक्तिवाद आहे की हे अंमलबजावणी आणि देखभाल खर्च कमी करतात, विशेषत: आपल्या संस्थेला अधिक संदर्भात मॉडेल तयार करण्यासाठी मॉडेल तयार करताना.
मॉडेलचा संदर्भ ज्या प्रकारे आणतो त्या मार्गाने त्यांना मिळू शकणार्या किंमतीच्या बचतीचे प्रमाण ठरते. ज्या लोकांना दीर्घ आणि जटिल सूचनांसारख्या मागण्यांच्या अतिरिक्त संदर्भांची आवश्यकता आहे अशा व्यक्तींसाठी, यामुळे विशिष्ट चिन्हाचा उच्च खर्च होऊ शकतो.
तो म्हणाला: “तुम्हाला संदर्भ मॉडेल्स एका प्रकारे किंवा दुसर्या मार्गाने द्यावे लागतील; तेथे विनामूल्य लंच नाही. परंतु मोठ्या मॉडेल्ससह, हे सहसा दाव्यात ठेवून केले जाते.” “संदर्भ मॉडेल देण्याचा वैकल्पिक मार्ग म्हणून परिष्कृत करण्याचा आणि प्रशिक्षणानंतर विचार करा. पोस्ट -ट्रेडिंग खर्चांपैकी मी 100 डॉलर्स घेऊ शकतो, परंतु ते खगोलशास्त्रीय नाही.”
सेनगुप्ता म्हणाले की त्यांनी केवळ एकट्या पोस्ट -ट्रेडिंगपासून सुमारे 100x खर्च पाहिले आणि मॉडेल वापरण्याची किंमत “लाखो दोन संख्येपासून सुमारे 30,000 डॉलर्सपर्यंत सोडली जाते.” त्यांनी सूचित केले आहे की या नंबरमध्ये सॉफ्टवेअर ऑपरेटिंग खर्च आणि मॉडेल डेटाबेस आणि वेक्टर डेटा नियमांची सतत किंमत समाविष्ट आहे.
ते म्हणाले: “देखभाल खर्चाच्या संदर्भात, जर आपण मानवी तज्ञांशी व्यक्तिचलितपणे असे केले तर ते महाग असू शकते कारण मोठ्या मॉडेल्ससाठी समान परिणाम मिळविल्यानंतर लहान मॉडेल्सना प्रशिक्षण देणे आवश्यक आहे.”
अनुभवी प्रयोगांनी हे सिद्ध केले की एक विशेष मॉडेल, जे एलएलएमएस प्रमाणेच वापरण्याच्या काही प्रकरणांसाठी चांगले कार्य करते, जे प्रत्येक गोष्टीऐवजी अधिक प्रभावीपणे वापरण्यासाठी अनेक मॉडेल प्रकाशित करते.
कंपनीने लामा -3.3-70 बी-इन्स्ट्रक्टच्या पोस्ट-ट्रेनिंग आवृत्तीची तुलना त्याच फॉर्मच्या लहान 8 बी पॅरामीटर पर्यायासह केली. B० बी मॉडेल, जे $ ११.30० नंतर प्रशिक्षित होते, स्वयंचलित मूल्यांकनांमध्ये % 84 % आणि मॅन्युअल मूल्यांकनांमध्ये % २ % अचूक होते. एकदा $ 4.58 च्या किंमतीची समायोजित झाल्यानंतर, 8 बी मॉडेलने मॅन्युअल मूल्यांकनात 82 % साध्य केले, जे साध्या, सर्वात लक्ष्यित वापराच्या परिस्थितीसाठी योग्य असेल.
खर्च घटक उद्देशाने योग्य आहेत
कार्यक्षमतेच्या किंमतीवर योग्य मॉडेल येऊ नये. आजकाल, संस्था समजतात की मॉडेल निवडणे म्हणजे केवळ जीपीटी -4 ओ किंवा लामा -3.1 दरम्यान निवडणे; त्याला माहित आहे की कोडचा सारांश देणे किंवा व्युत्पन्न करणे यासारख्या काही प्रकरणे एका लहान मॉडेलद्वारे अधिक चांगल्या प्रकारे सादर केल्या जातात.
कॉन्टॅक्ट सेंटर एआय प्रॉडक्ट्स क्रेस्टाचे मुख्य तंत्रज्ञान अधिकारी डॅनियल हस्क म्हणाले की एलएलएमएससह विकासाची सुरूवात चांगली आणि चांगली खर्च बचत आहे.
ते म्हणाले: “आपण जे काही काम करत आहात ते सर्व काही कार्य करीत आहे की नाही हे पाहण्यासाठी आपण सर्वात शैलीसह प्रारंभ केला पाहिजे, कारण जर ते सर्वात मोठ्या मॉडेलसह यशस्वी झाले नाही तर याचा अर्थ असा नाही की ते लहान मॉडेलसह असेल.”
रॅम्पिंग म्हणाले की लिंक्डइन समान पॅटर्नचे अनुसरण करते कारण प्रारंभिक मॉडेल्स हा एकमेव मार्ग आहे की या समस्या उद्भवू शकतात.
“सामान्य हेतूंसाठी एलएलएमच्या नोकरीच्या वापरासाठी आमचा विशिष्ट दृष्टीकोन सुरू होतो कारण विस्तृत सामान्यीकरण आम्हाला प्रारंभिक मॉडेल द्रुतगतीने द्रुतपणे अनुमती देते, गृहीतकांची तपासणी करण्यास आणि उत्पादन बाजाराच्या योग्यतेचे मूल्यांकन करण्यास अनुमती देते.” “उत्पादन पिकविण्यामुळे आणि आम्हाला गुणवत्ता, खर्च किंवा जिरेवरील निर्बंधांचा सामना करावा लागतो, आम्ही अधिक सानुकूलित उपायांकडे जाऊ.”
प्रयोग टप्प्यात, संस्था कृत्रिम बुद्धिमत्ता अनुप्रयोगांमधून सर्वात अंदाजे अंदाजे निर्धारित करू शकतात. हे शोधण्यामुळे विकसकांना त्यांचे लक्ष्य आणि बजेटला अनुकूल असलेल्या मॉडेलचा आकार निश्चित करण्याची आणि ते काय प्रदान करायचे आहे याची अधिक चांगली योजना तयार करण्यास अनुमती देते.
तज्ञांनी असा इशारा दिला आहे की जरी ते विकसित होणार्या मॉडेलसह तयार करणे महत्वाचे आहे, परंतु उच्च शिक्षक एलएलएम नेहमीच अधिक महाग असतील. मोठ्या मॉडेल्सना नेहमीच कॉम्प्यूटिंग पॉवरची आवश्यकता असते.
तथापि, लहान आणि इच्छित मॉडेल्सचा अत्यधिक वापर देखील समस्या निर्माण करतो. डेटाचे उपाध्यक्ष आणि एडब्ल्यूएस येथील एआय जीटीएम रायल पाठक यांनी ब्लॉगच्या प्रकाशनात म्हटले आहे की खर्च सुधारणे केवळ कमी -एर्जी मॉडेल मॉडेलचा वापर करूनच नव्हे तर मॉडेलशी जुळण्यापासून कार्यांशी जुळवून घेते. छोट्या मॉडेल्समध्ये अधिक जटिल सूचना समजण्यासाठी पुरेशी मोठी खिडकी असू शकत नाही, ज्यामुळे मानवी कर्मचार्यांसाठी कामाचे ओझे वाढते आणि खर्च वाढतो.
सेनगुप्ताने असा इशारा देखील दिला आहे की काही डिस्टिल्ड मॉडेल नाजूक असू शकतात, म्हणून दीर्घकालीन वापर प्रदान करू शकत नाही.
सतत मूल्यांकन
मॉडेलच्या आकाराची पर्वा न करता, औद्योगिक खेळाडूंनी कोणत्याही संभाव्य समस्या किंवा वापराच्या नवीन प्रकरणांचा सामना करण्यास लवचिकतेवर जोर दिला. म्हणून जर ते मोठ्या मॉडेलसह आणि समान किंवा चांगल्या कामगिरीसह आणि कमी किंमतीसह लहान मॉडेलसह प्रारंभ करत असतील तर संस्था त्यांच्या निवडलेल्या मॉडेलबद्दल मौल्यवान असू शकत नाहीत.
टेसा बर्ग, सीटीओ आणि मोड ऑप ब्रँड मार्केटींगमधील इनोव्हेशन हेड, व्हेंचरबिट म्हणाले की, संस्थांनी हे समजून घेतले पाहिजे की त्यांनी आता जे काही स्वीकारले त्या सर्व गोष्टी नेहमीच चांगल्या आवृत्तीसह बदलल्या जातील.
“आम्ही तयार केलेल्या वर्कफ्लोच्या खाली तंत्र आणि आम्ही अधिक कार्यक्षम बनवित असलेल्या प्रक्रियेत बदल होईल या मानसिकतेसह आम्ही प्रारंभ केला आहे. आम्हाला माहित आहे की आम्ही वापरत असलेले कोणतेही मॉडेल फॉर्मची सर्वात वाईट आवृत्ती असेल. “
बर्ग म्हणाले की छोट्या मॉडेल्सने संकल्पना शोधण्यात आणि विकसित करण्यात तिची कंपनी आणि एजंट्स वाचविण्यात मदत केली. ती म्हणाली की वेळोवेळी बजेट बचतीची वेळ वाचली आहे. तिने जोडले की हलके वजन मॉडेलचा उच्च -कोस्ट आणि उच्च -फ्रिक्वेन्सी वापर तोडणे चांगले आहे.
सेन्गुप्ता यांनी नमूद केले की विक्रेते आता मॉडेल्समधील बदल स्वयंचलितपणे सुलभ करतात, परंतु त्यांनी वापरकर्त्यांना कार्यक्षमता नियंत्रणास सुलभ करणारे प्लॅटफॉर्म शोधू नका असा इशारा दिला, जेणेकरून त्यांना अतिरिक्त खर्च मिळणार नाहीत.