Was ist Chain-of-Thought-Prompting?

Chain-of-Thought ist die Technik, ein Sprach-Modell zu bitten, seine Zwischen-Reasoning-Schritte vor der finalen Antwort auszuschreiben — entweder durch einen expliziten Prompt oder weil das Modell darauf trainiert wurde. Der Reasoning-Trace selbst wird Teil der Inference-Kosten.

Verbessert Chain-of-Thought die Genauigkeit wirklich?

Substanziell auf Multi-Step-Reasoning-Aufgaben (Mathematik, Logik, Multi-Hop-Dokument-Analyse, Code-Debugging). Bescheiden oder gar nicht auf Single-Step-Aufgaben wie Klassifikation, Extraktion oder einfachem Retrieval. Der Lift hängt davon ab, ob die Aufgabe tatsächlich Schritte braucht.

Sollten wir ein Reasoning-Modell nutzen oder für Chain-of-Thought prompten?

Reasoning-getunte Modelle produzieren standardmässig bessere Chain-of-Thought und sind meist schneller als ein allgemeines Modell Schritt-für-Schritt zu prompten. Sie kosten auch mehr pro Token. Wählen Sie nach Workflow: komplexes Reasoning bei Skala favorisiert das Reasoning-Modell; gelegentliches CoT innerhalb einer breiteren Pipeline favorisiert Prompting.

Ist Chain-of-Thought für den Endnutzer sichtbar?

Hängt von der Integration ab. Viele produktive Systeme verstecken die Chain in einem separaten Channel und surfen nur die finale Antwort, während sie die Chain in KI-Observability fürs Debugging speichern. Manche Produkte surfen das Reasoning absichtlich als Trust-Signal.

Chain-of-Thought · Morvion Glossar

Chain-of-Thought ist das Muster, bei dem das Modell gebeten wird, sein Reasoning laut (in Tokens) auszuschreiben, bevor es die finale Antwort produziert. Die Technik tauscht Inference- Kosten gegen Genauigkeit auf Aufgaben, wo Zwischenschritte zählen: Arithmetik, Multi-Hop-Reasoning, Planung, Code-Debugging.

Wie Chain-of-Thought genutzt wird.

Prompted. Der Prompt instruiert das Modell, Schritt für Schritt vor der Antwort zu denken. Die erste Generation von CoT, billig anzuwenden.
Trained-in. Neuere reasoning-getunte Modelle produzieren Chain-of-Thought standardmässig, oft unsichtbar hinter einem «Thinking»-Channel. Der Nutzer sieht nur die finale Antwort, aber die Schritte haben sie geformt.
Versteckt. Manche Provider trennen die Chain-of-Thought von der Antwort (damit Kunden das rohe Reasoning nicht sehen). Der Genauigkeits-Vorteil bleibt; der Audit-Trail hängt davon ab, ob der Provider den Trace exponiert.

Wann Chain-of-Thought hilft.

Aufgaben mit Multi-Step-Reasoning profitieren am meisten: Mathematik, logische Deduktion, Code-Generierung, Dokument- Analyse mit mehreren Constraints. Der Genauigkeits-Lift auf diesen Aufgaben kann substanziell sein, oft zweistellige Prozent-Punkte auf reasoning-lastigen Benchmarks.

Wann es nicht hilft.

Bei Single-Step-Retrieval- oder Klassifikations-Aufgaben fügt CoT Kosten ohne Genauigkeit hinzu. Bei kreativen Aufgaben (Drafting, Summary) kann CoT über-rationalisieren und brüchigeren Output produzieren. Die Faustregel: Wenn die Aufgabe das Kombinieren mehrerer Fakten oder Constraints involviert, nutzen Sie CoT; wenn die Aufgabe One-Shot-Recall oder -Generierung ist, lassen Sie es.

Caveats in Produktion.

Chain-of-Thought multipliziert Token-Verbrauch und damit Kosten und Latenz. Es exponiert auch Zwischen-Reasoning, das der Kunde vielleicht nicht sichtbar haben will. Produktive Systeme generieren CoT oft in einem versteckten Channel, evaluieren nur die finale Antwort und speichern die Chain fürs Debugging über KI-Observability.

Häufige Fragen.

Was ist Chain-of-Thought-Prompting?: Chain-of-Thought ist die Technik, ein Sprach-Modell zu bitten, seine Zwischen-Reasoning-Schritte vor der finalen Antwort auszuschreiben — entweder durch einen expliziten Prompt oder weil das Modell darauf trainiert wurde. Der Reasoning-Trace selbst wird Teil der Inference-Kosten.
Verbessert Chain-of-Thought die Genauigkeit wirklich?: Substanziell auf Multi-Step-Reasoning-Aufgaben (Mathematik, Logik, Multi-Hop-Dokument-Analyse, Code-Debugging). Bescheiden oder gar nicht auf Single-Step-Aufgaben wie Klassifikation, Extraktion oder einfachem Retrieval. Der Lift hängt davon ab, ob die Aufgabe tatsächlich Schritte braucht.
Sollten wir ein Reasoning-Modell nutzen oder für Chain-of-Thought prompten?: Reasoning-getunte Modelle produzieren standardmässig bessere Chain-of-Thought und sind meist schneller als ein allgemeines Modell Schritt-für-Schritt zu prompten. Sie kosten auch mehr pro Token. Wählen Sie nach Workflow: komplexes Reasoning bei Skala favorisiert das Reasoning-Modell; gelegentliches CoT innerhalb einer breiteren Pipeline favorisiert Prompting.
Ist Chain-of-Thought für den Endnutzer sichtbar?: Hängt von der Integration ab. Viele produktive Systeme verstecken die Chain in einem separaten Channel und surfen nur die finale Antwort, während sie die Chain in KI-Observability fürs Debugging speichern. Manche Produkte surfen das Reasoning absichtlich als Trust-Signal.

Englische Fassung: Chain-of-Thought on the EN edition.

Chain-of-Thought

Wie Chain-of-Thought genutzt wird.

Wann Chain-of-Thought hilft.

Wann es nicht hilft.

Caveats in Produktion.

Häufige Fragen.

Intelligente Systeme & KI-Infrastruktur

Weiter im Glossar.

KI-Infrastruktur

Eval-Harness

Regression Gate

RAG (Retrieval-Augmented Generation)

Model Context Protocol (MCP)

Agent Tool Use

LLM-Guardrails

Vektor-Index

Strukturierte Ausgabe

Prompt Injection

Observability-Traces

Agent-Handoff

Retrieval-Rerank

KI-Observability

Multi-Agent-Workflow

Embedding-Modell

Semantische Suche

Vektor-Datenbank

Fine-Tuning

Halluzination

Function Calling

Agentic Search

Embedding-Raum

Context-Window

Prompt Engineering

Vektor-Suche

Token-Budget

Semantischer Cache

Faithfulness

Cross-Encoder

Modell-Router

KI-Kostenkontrolle

Modell-Destillation

Safety-Rails

KI-Agent

CRM-Intelligenz

Document Intelligence

Eval-Driven KI

Discovery Sprint

Digital Operating Layer

Immersive Website

Hospitality-Website

Marktplatz-Plattform

Business Intelligence Dashboard

Echtzeit-Dashboard

Kunden-Portal

Agent-Memory

Strukturierte Extraktion

KI-Evaluations-Framework

Retrieval-Qualität

KI-Guardrail-Policy

Eval-Fixture

Eval-Rubrik

KI-Incident

Agent-Orchestrierung

Eval-Versionierung

Modell-Fallback

Fein-granulares Routing

KI-Policy-Versionskontrolle