Embedding (Vektor-Repräsentation)

Kategorie: KI-Grundlagen

Numerische Darstellung von Text oder Bildern als Vektor — Grundlage von Vektorsuchen und RAG.

Definition

Ein Embedding ist eine numerische Darstellung von Text, Bildern oder anderen Eingaben als Vektor in einem hochdimensionalen Raum. Inhaltlich ähnliche Eingaben liegen im Vektorraum nah beieinander, was semantische Suche und Vergleich ermöglicht.

Bedeutung im Unternehmenskontext

Embeddings sind die technische Grundlage der semantischen Suche und damit die Voraussetzung für Retrieval-Augmented Generation. Ein typischer RAG-Workflow funktioniert so: Alle Unternehmensdokumente werden in Embeddings umgewandelt und in einer Vektordatenbank gespeichert. Bei einer Nutzeranfrage wird auch diese in einen Vektor umgewandelt, die ähnlichsten Dokumente werden geholt und dem Sprachmodell als Kontext mitgegeben. Für die Auswahl der Embedding-Modelle gelten ähnliche Datenschutz-Erwägungen wie für Sprachmodelle: Werden die Inhalte an einen externen Anbieter übermittelt, oder läuft das Embedding lokal? Open-Source-Modelle wie Bge oder Multilingual-E5 erlauben vollständigen On-Premise-Betrieb.

Verwandte Begriffe

  • RAG
  • LLM
  • Token
  • Transformer

Weiterführend bei KBD

Individuelle KI-Modelle und Unternehmens-GPT

  • Zurück zur Glossar-Übersicht
  • KI-Glossar für Entscheider
  • Startseite

Embedding — KI-Glossar | KI-Beratung Deutschland