आधुनिक ग्राहकाला फक्त एक महत्त्वाची गरज आहे: ती मिळवणे गोष्ट त्यांना हवे आहे त्यांना पाहिजे तेव्हा. जुने मानक RAG मॉडेल + परतावा + LLM समाविष्ट करा हे हेतू चुकीचे समजून घेते, संदर्भावर जास्त भार टाकते आणि ताजेपणा नसतो, वारंवार ग्राहकांना चुकीच्या मार्गावर पाठवते.

त्याऐवजी, इंटेंट आर्किटेक्चर सर्वात संबंधित सामग्री स्रोतांना (दस्तऐवज, API आणि लोक) सोपवण्यापूर्वी, हेतू आणि संदर्भासाठी क्वेरीचे विश्लेषण करण्यासाठी प्रथम हलके भाषेचे मॉडेल वापरते.

एंटरप्राइझ एआय ही अथांग दिशेने जाणारी वेगवान ट्रेन आहे. संस्था LLM-आधारित शोध अनुप्रयोग विक्रमी गतीने तैनात करत आहेत, तर एक मूलभूत वास्तुशास्त्रीय समस्या आहे ज्यामुळे अपयश येते.

Coveo च्या अलीकडील अभ्यासातून असे दिसून आले आहे की 72% एंटरप्राइझ शोध क्वेरी पहिल्याच प्रयत्नात अर्थपूर्ण परिणाम प्रदान करण्यात अयशस्वी ठरतात, तर गार्टनरने असेही भाकीत केले आहे की बहुसंख्य संभाषणात्मक AI उपयोजन एंटरप्राइझच्या अपेक्षांपेक्षा कमी आहेत.

समस्या मूळ मॉडेल्सची नाही. त्यांच्या सभोवतालची वास्तुकला आहे.

जगातील काही मोठ्या दूरसंचार आणि आरोग्य सेवा संस्थांमध्ये लाखो ग्राहक आणि नागरिक वापरकर्त्यांना सेवा देत AI-चालित थेट ग्राहक प्रतिबद्धता प्लॅटफॉर्मची रचना आणि संचालन केल्यानंतर, मला एक नमुना दिसला. यशस्वी परस्परसंवादी AI-चालित उपयोजन आणि बहु-दशलक्ष डॉलर्सचे अपयश यातील फरक आहे.

तो मेघ देशी आहे बांधा मी ज्या शैलीला कॉल करतो प्रथम हेतू. संस्था एआय-संचालित अनुभव तयार करण्याच्या पद्धतीला आकार देत आहे.

$36 अब्ज समस्या

गार्टनरने भाकीत केले आहे की 2032 पर्यंत जागतिक संभाषणात्मक एआय मार्केट $36 अब्ज पर्यंत वाढेल. कंपन्या हिस्सा मिळविण्यासाठी झटत आहेत डेमो अप्रतिरोधक आहेत. तुमचा MBA तुमच्या ज्ञान बेसमध्ये प्लग करा आणि अचानक तो ग्राहकांच्या प्रश्नांना नैसर्गिक भाषेत उत्तर देऊ शकेल.

मग उत्पादन होते.

मी काम करत असलेल्या प्रमुख दूरसंचार पुरवठादारांपैकी एकाने समर्थन कॉल दर कमी करण्याच्या अपेक्षेने RAG प्रणाली आणली आहे. त्याऐवजी दर वाढले. कॉलर्सनी AI-शक्तीवर शोधण्याचा प्रयत्न केला, त्यांना उच्च आत्मविश्वासाने चुकीची उत्तरे मिळाली आणि ग्राहक समर्थनाला पूर्वीपेक्षा जास्त राग आला.

हा नमुना वारंवार पुनरावृत्ती होत आहे. हेल्थकेअरमध्ये, AI सहाय्यक ग्राहकांना प्रिस्क्रिप्शनची माहिती देतात जी आठवडे किंवा महिने जुनी आहे. आर्थिक सेवा चॅटबॉट्स किरकोळ आणि संस्थात्मक उत्पादन सामग्रीमधून उत्तरे देतात. किरकोळ विक्रेते उत्पादन शोधांमध्ये बंद केलेली उत्पादने दिसत आहेत.

समस्या कृत्रिम बुद्धिमत्ता तंत्रज्ञानाच्या अपयशाची नाही. हे स्थापत्यशास्त्राचे अपयश आहे

मानक RAG आर्किटेक्चर्स अयशस्वी का होतात

मानक RAG पॅटर्न-क्वेरी एम्बेडिंग, शब्दार्थाप्रमाणे समान सामग्री पुनर्प्राप्त करणे, आणि LLM ला उत्तीर्ण करणे—प्रात्यक्षिकांमध्ये आणि प्रूफ-ऑफ-संकल्पनांमध्ये सुंदरपणे कार्य करते. परंतु तीन प्रणालीगत कारणांमुळे उत्पादन वापराच्या प्रकरणांमध्ये ते खंडित होते:

1. हेतू अंतर

हेतू संदर्भ नाही. परंतु मानक RAG आर्किटेक्चर्स हे विचारात घेत नाहीत.

समजा एक ग्राहक “मला रद्द करायचे आहे” असे लिहितो याचा अर्थ काय? सेवा रद्द करायची? ऑर्डर रद्द करायची? भेट रद्द करायची? जसजसे आम्ही आमचे संप्रेषण सुरू केले, आम्हाला आढळले की 65% “रद्द” चौकशी प्रत्यक्षात ऑर्डर किंवा अपॉइंटमेंट बद्दल होती, सेवा रद्द न करण्याबद्दल. RAG प्रणालीकडे हा हेतू समजून घेण्याचा कोणताही मार्ग नव्हता, म्हणून ती सतत रद्दीकरणाची कागदपत्रे परत करत होती.

हेतू महत्त्वाचा. हेल्थकेअरमध्ये, जर एखाद्या रुग्णाने “मला रद्द करणे आवश्यक आहे” असे टाइप केले कारण ते अपॉइंटमेंट रद्द करण्याचा किंवा प्रिस्क्रिप्शन किंवा प्रक्रिया पुन्हा भरण्याचा प्रयत्न करत असल्यास, चार्टच्या औषध सामग्रीकडे निर्देशित केले जाणे केवळ निराशाजनकच नाही तर धोकादायक आहे.

2. संदर्भाचा पूर

आमचे संस्थात्मक ज्ञान आणि अनुभव विस्तृत आहे, ज्यामध्ये उत्पादन कॅटलॉग, इनव्हॉइस, समर्थन लेख, धोरणे, जाहिराती आणि खाते विवरणे यासारख्या डझनभर स्रोतांचा समावेश आहे. स्टँडर्ड RAG मॉडेल प्रत्येक क्वेरीवर शोधून सर्व काही समान प्रकारे हाताळतात.

जेव्हा एखादा ग्राहक विचारतो, “मी माझा नवीन फोन कसा सक्रिय करू,” त्यांना बिलिंग, स्टोअर स्थाने किंवा नेटवर्क स्थिती अद्यतनांबद्दल FAQ मध्ये स्वारस्य नसते. परंतु मानक RAG मॉडेल प्रत्येक स्त्रोतामधून शब्दार्थाप्रमाणे समान सामग्री पुनर्प्राप्त करते आणि लक्ष्यापासून अर्धा पाऊल दूर असलेले शोध परिणाम देते.

3. अंध स्थान ताजेपणा आहे

वेक्टर स्पेस वेळ अंध आहे. शब्दार्थानुसार, शेवटच्या तिमाहीतील प्रमोशन या तिमाहीप्रमाणेच आहे. परंतु ग्राहकांना कालबाह्य ऑफर दिल्याने विश्वास नष्ट होतो. कालबाह्य उत्पादने, ऑफर किंवा वैशिष्ट्ये दर्शविणाऱ्या शोध परिणामांशी आम्ही ग्राहकांच्या तक्रारींची मोठी टक्केवारी लिंक केली आहे.

हेतू-प्रथम आर्किटेक्चर शैली

इंटेंट-फर्स्ट आर्किटेक्चर पॅटर्न ही मानक RAG तैनातीची मिरर इमेज आहे. RAG मॉडेलमध्ये, तुम्ही पुनर्प्राप्त कराल आणि नंतर रूट करा. इंटेंट-फर्स्ट मॉडेलमध्ये, तुम्ही रूटिंग किंवा पुनर्प्राप्त करण्यापूर्वी क्रमवारी लावा.

इंटेंट-फर्स्ट आर्किटेक्चर्स सर्वात संबंधित सामग्री स्रोतांना (दस्तऐवज, API, एजंट) पाठवण्यापूर्वी, हेतू आणि संदर्भासाठी क्वेरीचे विश्लेषण करण्यासाठी हलके भाषेचे मॉडेल वापरतात.

तुलना: इंटेंट फर्स्ट वि. मानक RAG

क्लाउड नेटिव्ह अंमलबजावणी

इंटेंट-फर्स्ट पॅटर्न क्लाउड-नेटिव्ह डिप्लॉयमेंट, एंटरप्राइझ ट्रॅफिक पॅटर्न हाताळण्यासाठी मायक्रो सर्व्हिसेस, कंटेनर्स आणि लवचिक स्केलिंगसाठी डिझाइन केले आहे.

हेतू वर्गीकरण सेवा

कोणतीही पुनर्प्राप्ती होण्यापूर्वी वर्गीकरणकर्ता वापरकर्त्याचा हेतू निर्धारित करतो:

अल्गोरिदम: हेतू वर्गीकरण

इनपुट: user_query(स्ट्रिंग)

आउटपुट: int_result(ऑब्जेक्ट)

1. प्रीक्वेरी (सामान्यीकरण, आकुंचन विस्तार)

2. ट्रान्सफॉर्मर मॉडेल वापरून वर्गीकरण:

– प्राथमिक हेतू ← model.predict(क्वेरी)

– आत्मविश्वास ← model.confidence_score()

3. जर आत्मविश्वास <0.70 असेल तर

– परतावा {

आवश्यक_स्पष्टीकरण: खरे,

सुचवलेला प्रश्न: generator_clarifying_question(क्वेरी)

}

4. प्राथमिक हेतूवर आधारित उप-उद्देश काढणे:

– जर प्राथमिक = "खाते" → ORDER_STATUS, प्रोफाइल इ. तपासा.

– जर प्राथमिक = "समर्थन करते" → DEVICE_ISSUE, NETWORK इ. तपासा.

– जर प्राथमिक = "पावत्या" → पेमेंट पडताळणी, विवाद इ.

5. हेतू मॅपिंगवर आधारित लक्ष्य_स्रोत परिभाषित करा:

– ORDER_STATUS → (orders_db, order_faq)

– DEVICE_ISSUE → (TROUBLESHOOTING_KB, DEVICE_GUIDE)

– औषध → (प्रिस्क्रिप्शन, क्लिनिकल_दस्तऐवज) (आरोग्य सेवा)

6. परतावा {

प्राथमिक हेतू,

उप-उद्देश,

विश्वास

स्रोत_ध्येय,

सानुकूलन आवश्यक आहे: सत्य/असत्य

}

संदर्भ-जागरूक पुनर्प्राप्ती सेवा

एकदा हेतू वर्गीकृत झाल्यानंतर, पुनर्प्राप्ती लक्ष्यित होते:

अल्गोरिदम: संदर्भ-जागरूक पुनर्प्राप्ती

इनपुट: query,int_result,user_context

आउटपुट: rank_documents

1. intent_result.sub_intent साठी source_config मिळवा:

– प्राथमिक_स्रोत ← संशोधनासाठी स्रोत

– वगळलेले स्रोत → वगळले पाहिजेत

– ताजेपणा_दिवस ← सामग्रीचे कमाल वय

2. हेतूला वैयक्तिकरण आवश्यक असल्यास आणि वापरकर्ता प्रमाणीकृत असल्यास:

– खाते सेवेमधून account_context आणा

– जर हेतू = ORDER_STATUS:

– अलीकडील ऑर्डर मिळवा (गेले 60 दिवस)

– परिणामांमध्ये जोडा

3. शोध फिल्टर तयार करा:

-सामग्री_प्रकार ← केवळ प्राथमिक_स्रोत

– ताजेपणासाठी कमाल वय ← दिवस

– वापरकर्ता_संदर्भ ← खाते_संदर्भ (उपलब्ध असल्यास)

4. प्राथमिक_स्रोतांमधील प्रत्येक स्रोतासाठी:

– दस्तऐवज → वेक्टर_शोध (क्वेरी, स्रोत, फिल्टर)

– निकालांमध्ये कागदपत्रे जोडा

5. प्रत्येक दस्तऐवज रेकॉर्ड करा:

– प्रासंगिकतेची डिग्री → वेक्टर समानता × 0.40

– ताजेपणाची डिग्री ← ताजेपणा_वजन × 0.20

– वैयक्तिकरणाची पदवी → वापरकर्ता जुळणारे x ०.२५

-int_match_score ← type_match × 0.15

– एकूण_गुण ← वरील बेरीज

6. एकूण_स्कोअर नुसार उतरत्या क्रमाने क्रमवारी लावा

7. शीर्ष 10 दस्तऐवज परत करा

आरोग्यविषयक विचार

आरोग्यसेवा उपयोजनांमध्ये, हेतू-प्रथम पॅटर्नमध्ये अतिरिक्त सुरक्षा उपायांचा समावेश आहे:

आरोग्य सेवेच्या हेतूंच्या श्रेणी:

  • क्लिनिकल: औषधोपचार प्रश्न, लक्षणे आणि काळजी सूचना

  • कव्हरेज: फायदे, पूर्व अधिकृतता, सूत्र

  • शेड्युलिंग: सेवा प्रदात्याच्या भेटी आणि उपलब्धता

  • पावत्या: दावे, देयके आणि डेटा

  • खाते: वैयक्तिक फाइल, अवलंबित, ओळखपत्र

गंभीर संरक्षण: क्लिनिकल चौकशींमध्ये नेहमीच अस्वीकरण समाविष्ट असते आणि व्यावसायिक वैद्यकीय सल्ल्याची कधीही जागा घेत नाही. प्रणाली मानवी समर्थनासाठी जटिल क्लिनिकल प्रश्नांना मार्ग देते.

काठ प्रकरणे हाताळणे

एज केसेस जेथे सिस्टीम अयशस्वी होतात. इंटेंट-फर्स्ट पॅटर्नमध्ये विशिष्ट हँडलर समाविष्ट आहेत:

निराशा शोध कीवर्ड:

  • क्रोध: "छान," "सर्वात वाईट," "तो द्वेष करतो," "मूर्ख"

  • वेळ: "तास," "दिवस" "अजून वाट बघतोय"

  • अयशस्वी होणे: "निरुपयोगी" "मदत नाही," "ते चालत नाही"

  • वाढ "माणसाशी बोला," "खरी व्यक्ती," "बॉस"

जेव्हा निराशा आढळते, तेव्हा शोध पूर्णपणे वगळा आणि मानवी समर्थनाकडे वळवा.

संपूर्ण उद्योगात अनुप्रयोग

जिथे जिथे संस्था विविध सामग्रीवर संभाषणात्मक AI तैनात करतात तिथे हेतू-प्रथम पॅटर्न लागू होतो:

उद्योग

हेतू श्रेणी

प्रमुख फायदा

दूरसंचार

विक्री, समर्थन, बिलिंग, खाते, धारणा

ते निषिद्ध आहे "रद्द करतो" खराब वर्गीकरण

आरोग्य सेवा

क्लिनिकल, कव्हरेज, शेड्यूलिंग, बिलिंग

प्रशासकीय पासून क्लिनिकल वेगळे

आर्थिक सेवा

किरकोळ, संस्थात्मक, कर्ज देणे आणि विमा

संदर्भ मिक्सिंग प्रतिबंधित करते

किरकोळ

उत्पादन, ऑर्डर, परतावा, निष्ठा

प्रचारात्मक ताजेपणा सुनिश्चित करते

परिणाम

टेलिकॉम आणि हेल्थकेअर प्लॅटफॉर्मवर इंटेंट-फर्स्ट आर्किटेक्चर लागू केल्यानंतर:

मेट्रिक

प्रभाव

क्वेरी यश दर

जवळजवळ दुप्पट

समर्थन वाढ

अर्ध्याहून अधिक कमी

तोडगा काढण्याची वेळ आली आहे

अंदाजे 70% ने कमी

वापरकर्ता समाधान

अंदाजे 50% ने सुधारले

परतावा वापरकर्ता दर

दुपटीहून अधिक

वापरकर्ता परतावा दर सर्वात महत्वाचा असल्याचे सिद्ध झाले. जेव्हा शोध कार्य करते, तेव्हा वापरकर्ते परत येतात. जेव्हा ते अयशस्वी होते, तेव्हा ते चॅनल पूर्णपणे सोडून देतात, इतर सर्व समर्थन चॅनेलवर खर्च वाढवतात.

धोरणात्मक अत्यावश्यक

संभाषणात्मक एआय मार्केट हायपर ग्रोथ अनुभवत राहील.

परंतु मॉड्यूलर आरएजी आर्किटेक्चर तयार आणि तैनात करणाऱ्या संस्था अयशस्वी होत राहतील… वारंवार.

AI विश्वसनीयपणे चुकीची उत्तरे देईल, वापरकर्ते निराश होऊन डिजिटल चॅनेल सोडून देतील आणि समर्थन खर्च कमी होण्याऐवजी वाढेल.

इंटेंट-फर्स्ट ही संस्थांना एआय-सक्षम ग्राहक संभाषणे कशी डिझाइन आणि तयार करण्याची आवश्यकता आहे यात मूलभूत बदल आहे. हे चांगले मॉडेल किंवा अधिक डेटाबद्दल नाही. तुम्ही त्यांना मदत करण्याचा प्रयत्न करण्यापूर्वी वापरकर्त्याला काय हवे आहे हे समजून घेणे हे आहे.

जितक्या लवकर एखादी संस्था वास्तुशास्त्रीय गरज म्हणून ओळखेल, तितक्या लवकर या तंत्रज्ञानामुळे सक्षम होणारे कार्यक्षमतेचे फायदे लक्षात येऊ शकतील. जे लोक AI मधील त्यांच्या गुंतवणुकीमुळे येणाऱ्या अनेक वर्षांपासून अपेक्षित व्यवसाय परिणाम मिळत नाहीत, त्यांची कारणे दुरुस्त करतील.

सादरीकरण सोपे आहे. उत्पादन अवघड आहे. परंतु उत्पादन यशाचा नमुना स्पष्ट आहे: प्रथम हेतू.

श्रीनिवास रेड्डी होलिबिडू रेड्डी तो एक प्रमुख सॉफ्टवेअर अभियंता आणि एंटरप्राइझ आर्किटेक्ट आहे

Source link