RAG (Retrieval-Augmented Generation)
Kategorie: KI-Konzepte und Methoden
Sprachmodell-Architektur, die vor jeder Antwort gezielt in einer Wissensbasis recherchiert.
Definition
Retrieval-Augmented Generation (RAG) ist eine Architektur, bei der ein Sprachmodell vor jeder Antwort gezielt in einer angeschlossenen Wissensbasis recherchiert und die gefundenen Inhalte als Kontext in seine Antwort einarbeitet.
Bedeutung im Unternehmenskontext
RAG ist die Standardarchitektur für Unternehmens-KI, die mit aktuellen, internen oder vertraulichen Informationen arbeiten soll. Klassische Sprachmodelle wissen nur das, was bis zum Trainingszeitpunkt öffentlich verfügbar war. Ein RAG-System bekommt Zugriff auf eine eigene Datenquelle — beispielsweise Produkthandbücher, Vertragsdokumente, Support-Tickets oder Wikis — und kann daraus präzise, belegbare Antworten erzeugen. Das verringert Halluzinationen, ermöglicht Quellenangaben pro Antwort und macht Rechte- und Berechtigungsverwaltung handhabbar, weil das Sprachmodell selbst keine Daten enthält. Im Mittelstand wird RAG typischerweise eingesetzt für Wissensportale, Kundenservice-Chatbots, technische Assistenzsysteme und interne Suchen.
Verwandte Begriffe
Häufige Fragen
Wann ist RAG sinnvoller als Fine-Tuning?
Immer, wenn das Wissen sich häufig ändert, die Datenmenge groß ist oder Nachvollziehbarkeit per Quellenangabe gefordert ist. Fine-Tuning lohnt sich für stabile Stil- und Formatvorgaben, nicht für Faktenwissen.
Brauche ich für RAG eine eigene Vektordatenbank?
Für produktive Systeme im Mittelstand: ja. Geeignet sind etwa Qdrant, Weaviate oder Postgres mit pgvector — alle als On-Premise-Variante verfügbar.