แชตบอต RAG
แชตบอต RAG คือ conversational AI ที่ใช้การสร้างคำตอบแบบเสริมด้วยการดึงข้อมูล (retrieval-augmented generation): มันค้นหาข้อมูลที่เกี่ยวข้องจากแหล่งความรู้ในตอนที่ตอบคำถาม และใช้เนื้อหาที่ดึงมานั้นเป็นพื้นฐานของคำตอบ แทนที่จะพึ่งพาเพียงสิ่งที่โมเดลจดจำมาระหว่างการฝึกเท่านั้น
RAG ย่อมาจาก retrieval-augmented generation แชตบอต RAG ผสานโมเดลภาษาขนาดใหญ่เข้ากับขั้นตอนการดึงข้อมูล: เมื่อผู้ใช้ถามคำถาม ระบบจะค้นหาแหล่งความรู้ก่อน (บทความช่วยเหลือ เอกสารผลิตภัณฑ์ นโยบาย ทิกเก็ตในอดีต) เพื่อหาเนื้อหาที่เกี่ยวข้องที่สุด จากนั้นจึงส่งเนื้อหาเหล่านั้นให้โมเดลเป็นบริบท เพื่อให้คำตอบที่สร้างขึ้นอ้างอิงจากข้อมูลจริงที่เป็นปัจจุบัน แทนที่จะอ้างอิงจากข้อมูลฝึกทั่วไปของโมเดลเพียงอย่างเดียว
ในเชิงกลไก แหล่งความรู้มักถูกแบ่งออกเป็นชิ้นย่อย (chunk) แปลงเป็นเวกเตอร์ embedding และจัดเก็บในฐานข้อมูลเวกเตอร์หรือดัชนีการค้นหา ในตอนที่ค้นหา คำถามของผู้ใช้จะถูกแปลงเป็น embedding และจับคู่กับดัชนีนั้นเพื่อดึงเนื้อหาที่ใกล้เคียงที่สุด เนื้อหาเหล่านั้นจะถูกแทรกเข้าไปในพรอมต์ และโมเดลจะสร้างคำตอบที่อ้างอิงจากเนื้อหานั้น โดยมักมีการอ้างอิงกลับไปยังแหล่งที่มา
ข้อได้เปรียบหลักของ RAG เหนือโมเดลภาษาธรรมดาคือความถูกต้องและความทันสมัย เนื่องจากคำตอบผูกอยู่กับเนื้อหาที่ดึงมา แชตบอต RAG จึงสามารถสะท้อนข้อมูลที่ยังไม่มีอยู่ตอนที่โมเดลถูกฝึก สอดคล้องกับนโยบายเฉพาะของคุณ และลดการกุข้อมูลขึ้นมาเองด้วยการให้เนื้อหาที่เชื่อถือได้แก่โมเดลเป็นฐานในการทำงาน การอัปเดตฐานความรู้จะอัปเดตคำตอบของบอตทันที ไม่ต้องฝึกโมเดลใหม่
RAG ไม่ใช่ยาวิเศษ คุณภาพของคำตอบขึ้นอยู่กับคุณภาพของการดึงข้อมูลเป็นอย่างมาก: หากดัชนีขาดเนื้อหา แบ่งชิ้นไม่ดี หรือดึงเนื้อหาที่ไม่เกี่ยวข้องกลับมา โมเดลก็ยังคงสามารถสร้างคำตอบที่ผิดหรือคลุมเครือได้ ระบบ RAG ที่ดีจะลงทุนกับเนื้อหาต้นทางที่สะอาด การแบ่งชิ้นที่สมเหตุสมผล การจัดอันดับการดึงข้อมูลที่แม่นยำ และการตรวจสอบ grounding ที่ป้องกันไม่ให้โมเดลเตลิดออกไปนอกเหนือจากสิ่งที่ดึงมา
Mercateer ถูกสร้างขึ้นบนรูปแบบการเน้นฐานความรู้เป็นหลักนี้ เอเจนต์แต่ละตัวจะดึงข้อมูลจากเอกสาร คำถามที่พบบ่อย และนโยบายของคุณเอง และใช้เนื้อหานั้นเป็นพื้นฐานของคำตอบ เพื่อให้คำตอบยังคงถูกต้องและเป็นไปตามนโยบาย ใกล้เคียงกับระบบ RAG ที่สร้างมาอย่างดี มากกว่าแผนผังการตัดสินใจแบบเขียนสคริปต์ที่รู้แค่เส้นทางที่มีคนต่อสายไว้ล่วงหน้าเท่านั้น
คำที่เกี่ยวข้อง
