Technology: Retrieval Augmented Generation (RAG)

InsightGPT è un software di intelligenza artificiale basato sul framework Retrieval Augmented Generation.

flow-insightgpt

Il framework RAG è un approccio innovativo nell’elaborazione del linguaggio naturale (NLP) che combina i punti di forza dei modelli basati sul reperimento e sulla generazione. In RAG, il sistema recupera innanzitutto le informazioni rilevanti da un grande database (vector store) utilizzando un meccanismo di recupero.

Queste informazioni recuperate vengono poi utilizzate per aumentare il processo di generazione, in cui il modello genera risposte o output basati sia sulle informazioni recuperate che sulla query o sul contesto di input.

Questo framework migliora la comprensione contestuale del modello sfruttando le conoscenze esistenti dei dati recuperati, portando a risposte più accurate e coerenti. Il RAG è particolarmente efficace nei compiti in cui l’accesso al contesto rilevante è fondamentale per generare output di alta qualità.

La qualità dell’intero processo, che comprende sia la fase di recupero che quella di generazione, viene monitorata attraverso la misurazione di una serie di indicatori chiave di prestazione.
  • Precisione del contesto: indica la qualità della pipeline di recupero, valutando la pertinenza del contesto recuperato rispetto alla richiesta.
  • Context Recall: misura la capacità di recuperare tutte le informazioni necessarie in modo completo.
  • Fedeltà: valuta l’entità delle allucinazioni nelle risposte generate, assicurando la coerenza dei fatti rispetto al contesto dato.
  • Rilevanza delle risposte: misura quanto le risposte siano pertinenti alla domanda, valutando la rilevanza della risposta generata rispetto alla richiesta.
  • Correttezza delle Risposte: valuta l’accuratezza e l’affidabilità delle risposte generate da un sistema o modello. Comprende due aspetti principali.
  • Somiglianza Semantica: misura il grado di somiglianza tra la risposta generata e la risposta attesa in termini di significato, comprensione e contesto.
  • Somiglianza Fattuale: valuta l’accuratezza delle informazioni fornite nella risposta generata rispetto alla conoscenza fattuale o alla verità oggettiva. Valuta se le informazioni presentate sono fattualmente corrette e allineate al contesto della domanda o del prompt.
My Agile Privacy
Questo sito utilizza cookie tecnici e di profilazione. Cliccando su accetta si autorizzano tutti i cookie di profilazione. Cliccando su rifiuta o la X si rifiutano tutti i cookie di profilazione. Cliccando su personalizza è possibile selezionare quali cookie di profilazione attivare.

Learn how we helped 100 top brands gain success