जेव्हा लोक कृत्रिम बुद्धिमत्तेबद्दल बोलतात तेव्हा मी “ग्रेट लँग्वेज मॉडेल्स” किंवा एलएलएम या शब्दाबद्दल ऐकले आहे. परंतु हे चॅटजीपीटी, गूगल मिथुन, मायक्रोसॉफ्ट कॉपिलोट, मेटा एआय आणि क्लॉड्स सारख्या ब्रँड चॅट ब्रँडचे पूर्णपणे समानार्थी नाही.

ही चॅट प्रभावी परिणाम देऊ शकते, परंतु आपल्या शब्दांचा अर्थ प्रत्यक्षात समजत नाही. त्याऐवजी, आम्ही मोठ्या भाषेच्या मॉडेल्सशी संवाद साधण्यासाठी वापरतो हा इंटरफेस आहे. या मूलभूत तंत्रांना वारंवार एकत्र दिसणारे शब्द आणि शब्द कसे दिसतात हे समजून घेण्यासाठी प्रशिक्षण दिले आहे, जेणेकरून आपण शब्द, वाक्ये किंवा भविष्यातील कशेरुकाचा अंदाज लावू शकता. कृत्रिम बुद्धिमत्ता कशी कार्य करते हे समजून घेण्यासाठी एलएलएमएस कसे कार्य करते हे समजून घेणे ही एक गुरुकिल्ली आहे. आमच्या दैनंदिन ऑनलाइन अनुभवांमध्ये कृत्रिम बुद्धिमत्ता वाढत्या प्रमाणात सामान्य आहे, परंतु हे आपल्याला माहित असले पाहिजे.

आपल्याला एलएलएमएस आणि कृत्रिम बुद्धिमत्तेशी असलेल्या त्यांच्या संबंधांबद्दल आपल्याला हे माहित असणे आवश्यक आहे.

भाषा मॉडेल काय आहे?

आपण भाषेच्या मॉडेलचा शब्दांचा शांत विचार करू शकता.

जॉर्जियामधील जॉर्जिया ऑटोमॅटिक एज्युकेशन सेंटरचे इंटरएक्टिव्ह कॉम्प्यूटिंग आणि सहाय्यक संचालक जॉर्जिया टेक्नॉलॉजी कॉलेजचे प्राध्यापक मार्क रिडेल म्हणाले, “भाषा मॉडेल ही एक गोष्ट आहे जी मानवी भाषा काय दिसते याचा अंदाज घेण्याचा प्रयत्न करते.” “भाषेचे मॉडेल काय बनवते ते म्हणजे मागील शब्द देणार्‍या भविष्यातील शब्दांचा अंदाज लावू शकतो की नाही.”

मजकूर संदेश तसेच एआय चॅटबॉट्सकडून स्वयंचलितपणे पूर्ण होण्याचा हा आधार आहे.

मोठ्या भाषेचे मॉडेल काय आहे?

मोठ्या भाषेच्या मॉडेलमध्ये विस्तृत स्त्रोतांमधून मोठ्या प्रमाणात शब्द असतात. ही मॉडेल्स “पॅरामीटर्स” म्हणून ओळखल्या जाणार्‍या मोजल्या जातात.

तर, शिक्षक म्हणजे काय?

बरं, एलएलएमएस तंत्रिका नेटवर्क वापरते, जे स्वयंचलित शिक्षणासाठी मॉडेल आहेत जे एक इनपुट घेतात आणि परिणाम तयार करण्यासाठी क्रीडा खाती करतात. या खात्यांमधील व्हेरिएबल्सची संख्या पॅरामीटर्स आहे. उत्कृष्ट भाषेच्या मॉडेलमध्ये एक किंवा अधिक शिक्षक असू शकतात.

“आम्हाला माहित आहे की जेव्हा सुसंगत द्रवपदार्थाच्या मजकूराचा संपूर्ण परिच्छेद तयार होतो तेव्हा ते छान आहे,” रिडल म्हणाले.

आपण मोठ्या भाषेचे मॉडेल कसे शिकता?

डीप लर्निंग नावाच्या कोर एआय प्रक्रियेद्वारे एलएलएम शिकले.

जेसन lan लन स्नायडर, वर्ल्ड सीटीओने जगभरातील जाहिरात एजन्सीला सांगितले की, “जेव्हा आपण एखाद्या मुलाला शिकवता तेव्हा असेच आहे – आपण बरीच उदाहरणे दाखवता.”

दुस words ्या शब्दांत, आपण कृत्रिम बुद्धिमत्ता कंपन्यांसाठी एलएलएम डेटा संग्रह आणि प्रशिक्षण पद्धती फीड करू शकता हा काही वाद आणि काही खटल्यांचा विषय आहे. न्यूयॉर्क टाइम्स सारख्या प्रकाशक, कलाकार आणि इतर सामग्री मालक असा दावा करतात की तंत्रज्ञान कंपन्यांनी आवश्यक परवानग्याशिवाय त्यांचे कॉपीराइट वापरले आहेत.

.

कृत्रिम बुद्धिमत्ता मॉडेल त्याच्या आयुष्यात कोणीही वाचू शकतील त्यापेक्षा जास्त पचण्यायोग्य आहेत – जे कोट्यावधी प्रतीकांची व्यवस्था आहे. चिन्हे कृत्रिम बुद्धिमत्ता मॉडेलला मजकूर कोसळण्यास आणि संबोधित करण्यास मदत करतात. आपण कृत्रिम बुद्धिमत्ता मॉडेलचा वाचक म्हणून विचार करू शकता ज्यांना मदतीची आवश्यकता आहे. मॉडेल पूर्णपणे लहान तुकड्यांमध्ये विभागले गेले आहे, किंवा विशिष्ट चिन्हे-जे इंग्रजीतील चार अक्षरे समतुल्य आहेत, किंवा शब्दाच्या सुमारे तीन चतुर्थांश आणि नंतर प्रत्येक तुकडा आणि नंतर सामान्य अर्थ समजू शकतात.

तिथून, एलएलएम शब्द कसे कनेक्ट करावे आणि बर्‍याचदा एकत्र दिसणारे शब्द कसे परिभाषित करावे याचे विश्लेषण करू शकतात.

“हे शब्दांचा हा राक्षस नकाशा बनवण्यासारखे आहे,” स्नायडर म्हणाला. “मग तो खरोखर मजा करण्यास सक्षम होऊ लागतो, जो उत्कृष्ट आहे आणि खालील शब्द काय आहे याची अपेक्षा करतो … हे डेटामधील वास्तविक शब्दाच्या अंदाजाची तुलना करते आणि त्याच्या अचूकतेवर आधारित अंतर्गत नकाशाचे समायोजित करते.”

ही भविष्यवाणी आणि बदल कोट्यवधी वेळा उद्भवतात, म्हणून एलएलएम भाषा आणि नमुन्यांची ओळख पटवून आणि भविष्यातील शब्दांचा अंदाज लावण्यामध्ये सुधारणा आणि सुधारणा सुधारत आहे. डेटाच्या संकल्पना आणि तथ्ये देखील प्रश्नांची उत्तरे, सर्जनशील मजकूर स्वरूप तयार करणे आणि भाषांचे भाषांतर करणे शिकू शकतात. परंतु आमच्याप्रमाणे शब्दांचा अर्थ त्यांना समजत नाही – त्यांना माहित आहे की सांख्यिकीय संबंध आहेत.

एलएलएम मानवी टिप्पण्या वाढविण्यासाठी शिकून त्यांचे प्रतिसाद सुधारण्यास देखील शिकतात.

कार्नेगी मेलॉन युनिव्हर्सिटी युनिव्हर्सिटी टेक्नॉलॉजी इन्स्टिट्यूटचे सहाय्यक प्राध्यापक मार्टिन सबब यांनी सांगितले की, “तुम्हाला मिळालेल्या लोकांकडून निर्णय किंवा पसंती मिळते जे त्यापेक्षा चांगले प्रतिसाद मिळाले होते.” “मग आपण मॉडेलला त्याचे प्रतिसाद सुधारण्यासाठी शिकवू शकता.”

एक माणूस एआय आणि एलएलएम असलेल्या तीन -आयामी मेंदूत काढतो

एलएलएमएस काही कार्ये हाताळण्यात चांगले आहे परंतु इतर नाही.

अलेक्झांडर सीकोव्ह/इस्टॉक/गेटी प्रतिमा अधिक

मोठी भाषा मॉडेल्स काय करतात?

इनपुट शब्दांच्या मालिकेकडे पहात असताना, एलएलएम खालील शब्दाच्या अनुक्रमात अंदाज लावेल.

उदाहरणार्थ, “मी खोल निळ्या रंगात प्रवास करण्यासाठी गेलो होतो …” या वाक्यांशाचा विचार करा

बहुतेक लोक कदाचित “समुद्र” चा अंदाज लावू शकतात कारण नौकाविहार, खोली आणि निळे हे सर्व शब्द आहेत जे आपण समुद्राशी जोडतो. दुस words ्या शब्दांत, प्रत्येक शब्द त्यानंतर काय घ्यावे याचा संदर्भ तयार करतो.

“हे उत्कृष्ट भाषिक मॉडेल्स, कारण त्यांच्याकडे बरेच पॅरामीटर्स आहेत, बरेच नमुने संचयित करू शकतात,” रिडेल म्हणाले. “हे संकेत निवडण्याची आणि त्यानंतर जे घडते त्याबद्दल खरोखर चांगले अंदाज लावण्याच्या क्षमतेत ते खूप चांगले आहेत.”

वेगवेगळ्या भाषेच्या मॉडेलचे प्रकार काय आहेत?

आपण ऐकलेल्या दोन प्रकारचे उप -श्रेणी आहेत, जसे की लहान, तर्कशास्त्र आणि मुक्त/मुक्त स्त्रोत. यापैकी काही मल्टीमीडिया मॉडेल्स, ज्याचा अर्थ असा आहे की ते केवळ मजकूरावरच नव्हे तर चित्रे, व्हिडिओ आणि ध्वनीवर देखील प्रशिक्षित आहेत. ते सर्व भाषा मॉडेल आहेत आणि समान कार्ये करतात, परंतु आपल्याला माहित असले पाहिजे असे काही मुख्य फरक आहेत.

छोट्या भाषेच्या मॉडेलसारखे काहीतरी आहे का?

होय. मायक्रोसॉफ्टसारख्या तंत्रज्ञान कंपन्यांनी “डिव्हाइसवर” चालविण्यासाठी डिझाइन केलेले लहान मॉडेल प्रदान केले आणि एलएलएम संगणनाच्या समान संसाधनांची आवश्यकता नाही, परंतु तरीही वापरकर्त्यांना कृत्रिम बुद्धिमत्तेच्या सामर्थ्याचा फायदा घेण्यास मदत केली.

कृत्रिम बुद्धिमत्तेतून विचार करण्याचे मॉडेल काय आहेत?

विचारांची मॉडेल्स हा एलएलएमचा एक प्रकार आहे. हे मॉडेल आपल्या प्रश्नांची उत्तरे देताना चॅटबॉटमधील विचार ट्रेनवरील पडद्यामागील विजेचे दृश्य देतात. आपण दीपसीक वापरल्यास आपण ही प्रक्रिया पाहिली असेल, जी चिनी चॅटबॉट एआय आहे.

पण ओपन आणि ओपन सोर्स मॉडेल्सचे काय?

तरीही, llms! हे मॉडेल ते कसे कार्य करतात याबद्दल थोडे अधिक पारदर्शक होण्यासाठी डिझाइन केलेले आहेत. ओपन सोर्स मॉडेल मॉडेल कसे तयार केले गेले हे कोणालाही पाहण्याची परवानगी देते आणि सामान्यत: कोणालाही सानुकूलित करणे आणि तयार करणे उपलब्ध असते. ओपन वेट मॉडेल निर्णय घेताना मॉडेलचे विशिष्ट गुणधर्म कसे वजन करतात याबद्दल एक अंतर्दृष्टी देते.

मोठ्या भाषेची मॉडेल्स काय चांगले करतात?

सामान्य दिसणारे शब्द आणि मजकूर यांच्यातील संबंध शोधण्यात एलएलएम खूप चांगले आहेत.

“ते इनपुट घेतात, जे बर्‍याचदा सूचनांचा संच असू शकतात, जसे की” हे माझ्यासाठी करा “,” मला या बद्दल सांगा “, किंवा” या सारांशित करा “आणि ते इनपुटमधून हे नमुने काढू शकतात आणि द्रव प्रतिसादाची लांब मालिका तयार करू शकतात.”

पण त्यांच्यात अनेक कमकुवतपणा आहेत.

मोठ्या भाषेची मॉडेल्स कुठे लढतात?

प्रथम, सत्य सांगणे चांगले नाही. खरं तर, ते कधीकधी गोष्टी योग्य वाटतात, जेव्हा चॅटजीपीटीने कायदेशीर सारांशात चुकीच्या समस्येच्या सहा प्रकरणे उद्धृत केल्या किंवा जेव्हा Google थंड असेल (मिथुनचा पूर्ववर्ती) आपल्या सौर यंत्रणेच्या बाहेरील ग्रहाच्या पहिल्या चित्रांसह जेम्स वेब दुर्बिणीला चुकीचे आहे. हे भ्रम म्हणून ओळखले जाते.

“ते या अर्थाने खूप विश्वासार्ह आहेत की ते उल्लंघन करतात आणि गोष्टी बर्‍याच गोष्टी बनवतात,” सॅप म्हणाला. “काहीही थुंकण्यासाठी ते प्रशिक्षित किंवा डिझाइनर नव्हते.”

ते पूर्वीच्या कोणत्याही गोष्टीपेक्षा पूर्णपणे भिन्न असलेल्या चौकशीसह संघर्ष करीत आहेत. कारण ते नमुने शोधण्यावर आणि त्यांना प्रतिसाद देण्यावर लक्ष केंद्रित करतात.

एक चांगले उदाहरण म्हणजे गणिताची समस्या अद्वितीय संचासह.

“तो हे खाते योग्यरित्या करू शकणार नाही कारण ते खरोखर गणिताचे निराकरण करीत नाही,” रिडेल म्हणाले. “आपण यापूर्वी पाहिलेल्या गणिताच्या प्रश्नांच्या मागील उदाहरणांशी आपल्या गणिताच्या प्रश्नाशी जोडण्याचा प्रयत्न करीत आहे.”

ते शब्दांपेक्षा जास्त कामगिरी करत असताना, ते भविष्याचा अंदाज लावण्यात चांगले नाहीत, ज्यात नियोजन आणि निर्णय घेण्याचा समावेश आहे.

“मानवांनी ज्या पद्धतीने नियोजन करण्याची कल्पना केली आहे … वेगवेगळ्या आपत्कालीन परिस्थितीबद्दल आणि पर्यायांबद्दल विचार करणे आणि पर्याय बनविण्याची कल्पना, सध्याच्या काळात आपल्या सध्याच्या मोठ्या भाषेच्या मॉडेल्ससाठी हे खरोखर कठीण अडथळा आहे,” रिडेल म्हणाले.

शेवटी, ते सध्याच्या घटनांनी ग्रस्त आहेत कारण त्यांचा प्रशिक्षण डेटा सहसा केवळ एका विशिष्ट बिंदूपर्यंत वाढतो आणि त्यानंतर काहीही घडते हे त्यांच्या ज्ञानाचा भाग नाही. वास्तविकतेत जे खरे आहे आणि जे शक्य आहे त्यात फरक करण्याची क्षमता त्यांच्यात नसल्यामुळे ते सतत चालू असलेल्या घटनांबद्दल आत्मविश्वासाने चुकीची माहिती देऊ शकतात.

हे आपल्या मार्गाने जगाशी संवाद साधत नाही.

“यामुळे त्यांना सध्याच्या घटनांच्या बारकावे आणि गुंतागुंत समजणे कठीण होते, ज्यास बर्‍याचदा संदर्भ, सामाजिक गतिशीलता आणि परिणाम समजून घेणे आवश्यक असते.”

शोध इंजिनसह एलएलएम कसे एकत्रित केले जातात?

आम्ही Google सारख्या शोध इंजिनशी संपर्क साधण्यासह प्रशिक्षण प्रशिक्षण पलीकडे पुनर्प्राप्ती होण्याच्या शक्यतांचा साक्षीदार आहोत जेणेकरून मॉडेल वेबवर कार्य करू शकतील आणि नंतर एलएलएममध्ये या परिणामांना खायला घालू शकतील. याचा अर्थ असा की ते क्वेरी अधिक चांगल्या प्रकारे समजू शकतात आणि वेळेत अधिक वेळ देऊ शकतात.

“हे आमच्या असोसिएशनच्या मॉडेल्सना राहण्यास आणि अद्यतनित करण्यास मदत करते कारण ते इंटरनेटवरील नवीन माहिती प्रत्यक्षात पाहू शकतात आणि त्यांना आणू शकतात,” रीड म्हणाले.

हे ध्येय होते, उदाहरणार्थ, त्याच एआयसह कार्य करणार्‍या बिंगसह काही काळानंतर. शोध इंजिनचा प्रतिसाद वाढविण्यासाठी फायदा घेण्याऐवजी मायक्रोसॉफ्टने आपले शोध इंजिन सुधारण्यासाठी कृत्रिम बुद्धिमत्तेकडे पाहिले, अंशतः ग्राहकांच्या चौकशीमागील खरा अर्थ समजून घेऊन आणि चौकशीच्या निकालांचे अधिक चांगले वर्गीकरण करून. गेल्या नोव्हेंबरमध्ये, ओपनईने काही बातम्या प्रकाशकांच्या माहितीवर प्रवेश करून चॅटजीपीटी संशोधन सादर केले.

पण भूक लागली आहे. इंटरनेटवर शोधण्यासाठी पुरेशी तथ्ये साध्य करण्यासाठी यंत्रणा न घेता भ्रम अधिकच खराब होऊ शकते. एलएलएमला वेब स्त्रोतांच्या विश्वासार्हतेचे संदर्भ देण्यापूर्वी कसे मूल्यांकन करावे हे शिकण्याची आवश्यकता असेल. Google ला शिकले की सामान्य संशोधन परिणामांच्या पहिल्या शो त्रुटींसह कठीण मार्ग कृत्रिम बुद्धिमत्तेत दिसून येतो. त्यानंतर शोध कंपनीने दिशाभूल करणारी किंवा संभाव्य धोकादायक सारांश कमी करण्यासाठी कृत्रिम बुद्धिमत्ता विहंगावलोकनचे परिणाम सुधारले. परंतु आधुनिक अहवालात असे आढळले की कृत्रिम बुद्धिमत्ता विहंगावलोकन वर्ष काय आहे हे आपल्याला सतत सांगू शकत नाही.

अधिक माहितीसाठी, आमच्या तज्ञांची कृत्रिम बुद्धिमत्ता मूलभूत गोष्टींची यादी आणि 2025 साठी सर्वोत्कृष्ट चॅटबॉट्स तपासा.

Source link