Chain-of-Thought ist das Muster, bei dem das Modell gebeten wird, sein Reasoning laut (in Tokens) auszuschreiben, bevor es die finale Antwort produziert. Die Technik tauscht Inference- Kosten gegen Genauigkeit auf Aufgaben, wo Zwischenschritte zählen: Arithmetik, Multi-Hop-Reasoning, Planung, Code-Debugging.

Wie Chain-of-Thought genutzt wird.

  • Prompted. Der Prompt instruiert das Modell, Schritt für Schritt vor der Antwort zu denken. Die erste Generation von CoT, billig anzuwenden.
  • Trained-in. Neuere reasoning-getunte Modelle produzieren Chain-of-Thought standardmässig, oft unsichtbar hinter einem «Thinking»-Channel. Der Nutzer sieht nur die finale Antwort, aber die Schritte haben sie geformt.
  • Versteckt. Manche Provider trennen die Chain-of-Thought von der Antwort (damit Kunden das rohe Reasoning nicht sehen). Der Genauigkeits-Vorteil bleibt; der Audit-Trail hängt davon ab, ob der Provider den Trace exponiert.

Wann Chain-of-Thought hilft.

Aufgaben mit Multi-Step-Reasoning profitieren am meisten: Mathematik, logische Deduktion, Code-Generierung, Dokument- Analyse mit mehreren Constraints. Der Genauigkeits-Lift auf diesen Aufgaben kann substanziell sein, oft zweistellige Prozent-Punkte auf reasoning-lastigen Benchmarks.

Wann es nicht hilft.

Bei Single-Step-Retrieval- oder Klassifikations-Aufgaben fügt CoT Kosten ohne Genauigkeit hinzu. Bei kreativen Aufgaben (Drafting, Summary) kann CoT über-rationalisieren und brüchigeren Output produzieren. Die Faustregel: Wenn die Aufgabe das Kombinieren mehrerer Fakten oder Constraints involviert, nutzen Sie CoT; wenn die Aufgabe One-Shot-Recall oder -Generierung ist, lassen Sie es.

Caveats in Produktion.

Chain-of-Thought multipliziert Token-Verbrauch und damit Kosten und Latenz. Es exponiert auch Zwischen-Reasoning, das der Kunde vielleicht nicht sichtbar haben will. Produktive Systeme generieren CoT oft in einem versteckten Channel, evaluieren nur die finale Antwort und speichern die Chain fürs Debugging über KI-Observability.

Häufige Fragen.

Was ist Chain-of-Thought-Prompting?
Chain-of-Thought ist die Technik, ein Sprach-Modell zu bitten, seine Zwischen-Reasoning-Schritte vor der finalen Antwort auszuschreiben — entweder durch einen expliziten Prompt oder weil das Modell darauf trainiert wurde. Der Reasoning-Trace selbst wird Teil der Inference-Kosten.
Verbessert Chain-of-Thought die Genauigkeit wirklich?
Substanziell auf Multi-Step-Reasoning-Aufgaben (Mathematik, Logik, Multi-Hop-Dokument-Analyse, Code-Debugging). Bescheiden oder gar nicht auf Single-Step-Aufgaben wie Klassifikation, Extraktion oder einfachem Retrieval. Der Lift hängt davon ab, ob die Aufgabe tatsächlich Schritte braucht.
Sollten wir ein Reasoning-Modell nutzen oder für Chain-of-Thought prompten?
Reasoning-getunte Modelle produzieren standardmässig bessere Chain-of-Thought und sind meist schneller als ein allgemeines Modell Schritt-für-Schritt zu prompten. Sie kosten auch mehr pro Token. Wählen Sie nach Workflow: komplexes Reasoning bei Skala favorisiert das Reasoning-Modell; gelegentliches CoT innerhalb einer breiteren Pipeline favorisiert Prompting.
Ist Chain-of-Thought für den Endnutzer sichtbar?
Hängt von der Integration ab. Viele produktive Systeme verstecken die Chain in einem separaten Channel und surfen nur die finale Antwort, während sie die Chain in KI-Observability fürs Debugging speichern. Manche Produkte surfen das Reasoning absichtlich als Trust-Signal.

Englische Fassung: Chain-of-Thought on the EN edition.