Chatbot RAG
Un chatbot RAG è una conversational AI che usa la generazione aumentata dal recupero (retrieval-augmented generation): al momento della risposta cerca le informazioni pertinenti in una fonte di conoscenza e usa quel contenuto recuperato per fondare la propria risposta, invece di basarsi solo su ciò che il modello ha memorizzato durante l'addestramento.
RAG sta per retrieval-augmented generation, ovvero generazione aumentata dal recupero. Un chatbot RAG combina un large language model con una fase di recupero: quando un utente pone una domanda, il sistema cerca prima in una fonte di conoscenza (articoli di assistenza, documentazione di prodotto, policy, ticket passati) i passaggi più pertinenti, poi li passa al modello come contesto, così la risposta generata si basa su informazioni reali e aggiornate e non solo sui dati di addestramento generici del modello.
Dal punto di vista tecnico, la fonte di conoscenza viene di norma suddivisa in blocchi, convertita in vector embedding e archiviata in un database vettoriale o in un indice di ricerca. Al momento della query, la domanda dell'utente viene trasformata in embedding e confrontata con quell'indice per recuperare i passaggi più affini. Tali passaggi vengono inseriti nel prompt e il modello genera una risposta che vi attinge, spesso con citazioni che rimandano alla fonte.
Il vantaggio principale del RAG rispetto a un semplice modello linguistico è l'accuratezza e l'attualità. Poiché le risposte sono legate al contenuto recuperato, un chatbot RAG può riflettere informazioni che non esistevano quando il modello è stato addestrato, restare allineato alle tue policy specifiche e ridurre le allucinazioni fornendo al modello materiale autorevole su cui lavorare. Aggiornare la knowledge base aggiorna le risposte del bot. Nessun riaddestramento del modello richiesto.
Il RAG non è una soluzione miracolosa. La qualità delle risposte dipende fortemente dalla qualità del recupero: se all'indice mancano contenuti, è suddiviso male o restituisce passaggi irrilevanti, il modello può comunque produrre risposte errate o vaghe. I buoni sistemi RAG investono in contenuti sorgente puliti, una suddivisione sensata, un solido ranking del recupero e controlli di grounding che impediscono al modello di andare oltre ciò che è stato recuperato.
Mercateer è costruito su questo approccio che parte dalla conoscenza. Ogni agent recupera dalla tua documentazione, dalle FAQ e dalle policy e fonda le proprie risposte su quel materiale, così le risposte restano accurate e conformi alle policy, più vicine a un sistema RAG ben realizzato che a un albero decisionale predefinito, che conosce solo i percorsi che qualcuno ha cablato a mano in anticipo.
Termini correlati
