צ'אטבוט RAG
צ'אטבוט RAG הוא בינה מלאכותית שיחתית שמשתמשת ביצירה מועשרת-אחזור (retrieval-augmented generation): היא מאתרת מידע רלוונטי ממקור ידע בזמן המענה ומשתמשת בתוכן שאוחזר כדי לבסס את תשובתה, במקום להסתמך רק על מה שהמודל שינן במהלך האימון.
RAG ראשי תיבות של retrieval-augmented generation (יצירה מועשרת-אחזור). צ'אטבוט RAG משלב מודל שפה גדול עם שלב אחזור: כשמשתמש שואל שאלה, המערכת מחפשת תחילה במקור ידע (מאמרי עזרה, תיעוד מוצר, מדיניות, כרטיסים קודמים) את הקטעים הרלוונטיים ביותר, ואז מעבירה את הקטעים האלה למודל כהקשר, כך שהתשובה הנוצרת מבוססת על מידע אמיתי ועדכני ולא רק על נתוני האימון הכלליים של המודל.
מבחינה טכנית, מקור הידע מפורק בדרך כלל למקטעים, מומר להטמעות וקטוריות (vector embeddings) ונשמר במסד נתונים וקטורי או באינדקס חיפוש. בזמן השאילתה, שאלת המשתמש מוטמעת ומותאמת מול אותו אינדקס כדי לאחזר את הקטעים הקרובים ביותר. הקטעים האלה מוכנסים להנחיה, והמודל יוצר תשובה שמסתמכת עליהם, לעיתים קרובות עם הפניות חזרה למקור.
היתרון העיקרי של RAG על פני מודל שפה רגיל הוא דיוק ועדכניות. מכיוון שהתשובות קשורות לתוכן שאוחזר, צ'אטבוט RAG יכול לשקף מידע שלא היה קיים בזמן אימון המודל, להישאר תואם למדיניות הספציפית שלכם, ולהפחית הזיות על ידי מתן חומר סמכותי שהמודל יכול לעבוד ממנו. עדכון מאגר הידע מעדכן את תשובות הבוט. אין צורך באימון מחדש של המודל.
RAG אינו פתרון קסם. איכות התשובה תלויה במידה רבה באיכות האחזור: אם באינדקס חסר תוכן, הוא מפורק למקטעים בצורה לקויה, או מחזיר קטעים לא רלוונטיים, המודל עדיין עלול לייצר תשובות שגויות או מעורפלות. מערכות RAG טובות משקיעות בתוכן מקור נקי, פירוק למקטעים הגיוני, דירוג אחזור חזק ובדיקות ביסוס ששומרות על המודל מלסטות מעבר למה שאוחזר.
Mercateer בנוי על תבנית מבוססת-הידע הזו. כל סוכן מאחזר מהמסמכים, השאלות הנפוצות והמדיניות שלכם ומבסס את תשובותיו על אותו חומר, כך שהתשובות נשארות מדויקות ותואמות-מדיניות, קרוב יותר למערכת RAG בנויה היטב מאשר לעץ החלטה כתוב מראש שמכיר רק את המסלולים שמישהו חיווט ידנית מבעוד מועד.
מונחים קשורים
