Token
Kategorie: KI-Grundlagen
Kleinste Verarbeitungseinheit eines Sprachmodells — meist Wortteil oder Satzzeichen, Basis der Abrechnung.
Definition
Ein Token ist die kleinste Einheit, in die ein Sprachmodell Text zerlegt, bevor es ihn verarbeitet. Tokens entsprechen meistens Wortteilen, einzelnen Wörtern oder Satzzeichen — als Faustregel: 1.000 Tokens entsprechen rund 750 deutschen Wörtern.
Bedeutung im Unternehmenskontext
Tokens sind die Recheneinheit für Sprachmodelle und gleichzeitig die Abrechnungsbasis bei den meisten Anbietern. Eingehende und ausgehende Tokens werden separat gezählt, wobei Output-Tokens üblicherweise teurer sind. Praktisch heißt das: Wer einen Chatbot mit langen Systemprompts und großem Wissenskontext baut, sollte Token-Verbrauch und -Kosten von Anfang an mitkalkulieren. Auch das Kontextfenster eines Modells — die maximale Anzahl gleichzeitig verarbeitbarer Tokens — ist eine harte Grenze: Ein Modell mit 128.000 Token-Kontext kann etwa ein 200-seitiges PDF auf einmal lesen, ein älteres Modell mit 4.000 Tokens nur wenige Seiten.