RAG चैटबॉट

RAG चैटबॉट एक संवादी AI है जो रिट्रीवल-ऑगमेंटेड जनरेशन का इस्तेमाल करता है: यह जवाब देते समय किसी नॉलेज स्रोत से प्रासंगिक जानकारी खोजता है और अपने जवाब को उसी प्राप्त सामग्री पर आधारित रखता है, बजाय इसके कि केवल उसी पर भरोसा करे जो मॉडल ने प्रशिक्षण के दौरान याद किया था।

RAG का मतलब है रिट्रीवल-ऑगमेंटेड जनरेशन। एक RAG चैटबॉट एक बड़े लैंग्वेज मॉडल को एक रिट्रीवल चरण के साथ जोड़ता है: जब कोई उपयोगकर्ता सवाल पूछता है, तो सिस्टम पहले किसी नॉलेज स्रोत (हेल्प लेख, प्रोडक्ट डॉक्स, नीतियाँ, पुराने टिकट) में सबसे प्रासंगिक अंश खोजता है, फिर उन अंशों को संदर्भ के रूप में मॉडल को देता है ताकि तैयार किया गया जवाब केवल मॉडल के सामान्य प्रशिक्षण डेटा पर नहीं, बल्कि असली, मौजूदा जानकारी पर आधारित हो।

तकनीकी रूप से, नॉलेज स्रोत को आम तौर पर टुकड़ों (chunks) में बाँटा जाता है, वेक्टर एम्बेडिंग में बदला जाता है, और एक वेक्टर डेटाबेस या सर्च इंडेक्स में संग्रहित किया जाता है। क्वेरी के समय उपयोगकर्ता के सवाल को एम्बेड किया जाता है और सबसे क़रीबी अंश प्राप्त करने के लिए उस इंडेक्स से मिलान किया जाता है। उन अंशों को प्रॉम्प्ट में डाला जाता है, और मॉडल एक ऐसा जवाब तैयार करता है जो उन पर आधारित होता है, अक्सर स्रोत के संदर्भ (citations) के साथ।

किसी साधारण लैंग्वेज मॉडल की तुलना में RAG का मुख्य फ़ायदा सटीकता और ताज़गी है। चूँकि जवाब प्राप्त सामग्री से जुड़े होते हैं, इसलिए एक RAG चैटबॉट ऐसी जानकारी दिखा सकता है जो मॉडल के प्रशिक्षण के समय मौजूद ही नहीं थी, आपकी ख़ास नीतियों के अनुरूप बना रह सकता है, और मॉडल को काम करने के लिए प्रामाणिक सामग्री देकर मनगढ़ंत जवाबों को कम कर सकता है। नॉलेज बेस को अपडेट करने से बॉट के जवाब अपडेट हो जाते हैं। किसी मॉडल को दोबारा प्रशिक्षित करने की ज़रूरत नहीं।

RAG कोई जादुई उपाय नहीं है। जवाब की गुणवत्ता काफ़ी हद तक रिट्रीवल की गुणवत्ता पर निर्भर करती है: अगर इंडेक्स में सामग्री छूट गई हो, उसे ठीक से टुकड़ों में न बाँटा गया हो, या वह असंगत अंश लौटाए, तो मॉडल फिर भी ग़लत या अस्पष्ट जवाब दे सकता है। अच्छे RAG सिस्टम साफ़-सुथरी स्रोत सामग्री, समझदारी से की गई चंकिंग, मज़बूत रिट्रीवल रैंकिंग और ऐसी ग्राउंडिंग जाँचों में निवेश करते हैं जो मॉडल को प्राप्त सामग्री से आगे भटकने से रोकती हैं।

Mercateer इसी नॉलेज-फ़र्स्ट तरीक़े पर बना है। हर एजेंट आपके अपने डॉक्स, FAQ और नीतियों से सामग्री खींचता है और अपने जवाब उसी सामग्री पर आधारित रखता है, ताकि जवाब सटीक और नीति के अनुरूप बने रहें, किसी ऐसे स्क्रिप्टेड डिसीज़न ट्री की तुलना में एक बेहतर बने RAG सिस्टम के ज़्यादा क़रीब जो केवल वही रास्ते जानता है जिन्हें किसी ने पहले से हाथ से जोड़ रखा हो।

RAG चैटबॉट

इसे अपने ही ज्ञान पर काम करते देखें