Glossaire · Français

RAG

Génération augmentée par récupération : une technique LLM où le modèle récupère des documents pertinents avant de générer une réponse.

Français · French

Définition

La génération augmentée par récupération combine une étape de recherche avec une étape de génération. Au lieu de s'appuyer uniquement sur les données d'entraînement du modèle, le système récupère des fragments pertinents d'un corpus (vos documents, vos tickets de support, votre code) et les inclut dans le prompt. Cela ancre la réponse dans vos données réelles et réduit considérablement les hallucinations. Le RAG moderne utilise la récupération hybride (similarité vectorielle + recherche par mots-clés), le reranking et la traçabilité des citations afin que chaque réponse pointe vers une source.

Exemple

Une application legal-tech où le LLM cite le paragraphe exact de jurisprudence qu'il a utilisé pour répondre à une question.

Comment Vedwix utilise ceci

La plupart des fonctionnalités d'IA en production que nous construisons commencent comme des systèmes RAG. Nous utilisons la récupération hybride, des rerankers et une couche de citations pour que les utilisateurs puissent auditer chaque réponse.

Vous travaillez sur un projet de RAG?

RAG.

Décrivez votre projet en trois phrases ou moins.

Démarrer un projet

RAG

Décrivez votre projet en trois phrases ou moins.

Démarrer un projet