RAG (Retrieval-Augmented Generation)

Kategorie: KI-Konzepte und Methoden

Sprachmodell-Architektur, die vor jeder Antwort gezielt in einer Wissensbasis recherchiert.

Definition

Retrieval-Augmented Generation (RAG) ist eine Architektur, bei der ein Sprachmodell vor jeder Antwort gezielt in einer angeschlossenen Wissensbasis recherchiert und die gefundenen Inhalte als Kontext in seine Antwort einarbeitet.

Bedeutung im Unternehmenskontext

RAG ist die Standardarchitektur für Unternehmens-KI, die mit aktuellen, internen oder vertraulichen Informationen arbeiten soll. Klassische Sprachmodelle wissen nur das, was bis zum Trainingszeitpunkt öffentlich verfügbar war. Ein RAG-System bekommt Zugriff auf eine eigene Datenquelle — beispielsweise Produkthandbücher, Vertragsdokumente, Support-Tickets oder Wikis — und kann daraus präzise, belegbare Antworten erzeugen. Das verringert Halluzinationen, ermöglicht Quellenangaben pro Antwort und macht Rechte- und Berechtigungsverwaltung handhabbar, weil das Sprachmodell selbst keine Daten enthält. Im Mittelstand wird RAG typischerweise eingesetzt für Wissensportale, Kundenservice-Chatbots, technische Assistenzsysteme und interne Suchen.

Häufige Fragen

Wann ist RAG sinnvoller als Fine-Tuning?

Immer, wenn das Wissen sich häufig ändert, die Datenmenge groß ist oder Nachvollziehbarkeit per Quellenangabe gefordert ist. Fine-Tuning lohnt sich für stabile Stil- und Formatvorgaben, nicht für Faktenwissen.

Brauche ich für RAG eine eigene Vektordatenbank?

Für produktive Systeme im Mittelstand: ja. Geeignet sind etwa Qdrant, Weaviate oder Postgres mit pgvector — alle als On-Premise-Variante verfügbar.

Weiterführend bei KBD

Individuelle KI-Modelle und Unternehmens-GPT

RAG — KI-Glossar | KI-Beratung Deutschland