Embedding (Vektor-Repräsentation)
Kategorie: KI-Grundlagen
Numerische Darstellung von Text oder Bildern als Vektor — Grundlage von Vektorsuchen und RAG.
Definition
Ein Embedding ist eine numerische Darstellung von Text, Bildern oder anderen Eingaben als Vektor in einem hochdimensionalen Raum. Inhaltlich ähnliche Eingaben liegen im Vektorraum nah beieinander, was semantische Suche und Vergleich ermöglicht.
Bedeutung im Unternehmenskontext
Embeddings sind die technische Grundlage der semantischen Suche und damit die Voraussetzung für Retrieval-Augmented Generation. Ein typischer RAG-Workflow funktioniert so: Alle Unternehmensdokumente werden in Embeddings umgewandelt und in einer Vektordatenbank gespeichert. Bei einer Nutzeranfrage wird auch diese in einen Vektor umgewandelt, die ähnlichsten Dokumente werden geholt und dem Sprachmodell als Kontext mitgegeben. Für die Auswahl der Embedding-Modelle gelten ähnliche Datenschutz-Erwägungen wie für Sprachmodelle: Werden die Inhalte an einen externen Anbieter übermittelt, oder läuft das Embedding lokal? Open-Source-Modelle wie Bge oder Multilingual-E5 erlauben vollständigen On-Premise-Betrieb.