Glossar · Klare Definitionen
Das Morvion-Vokabular.
Kurze, klare Definitionen der Begriffe, gegen die wir ausliefern, geschrieben für Operatoren, die lieber wissen wollen, was etwas bedeutet, als dass es ihnen verkauft wird. Jeder Eintrag enthält einen Einzeiler, eine längere Erklärung und die Fragen, die uns am häufigsten gestellt werden.
Die deutsche Fassung deckt jetzt alle 60 Einträge ab — eins-zu-eins mit der englischsprachigen Glossar-Seite. Schweizer Hochdeutsch, mit den englischen Fachbegriffen dort, wo Engineers im DACH-Raum sie tatsächlich nutzen.
KI-Infrastruktur
KI-Infrastruktur ist die technische und architektonische Schicht, die ein Unternehmen KI-gesteuerte Workflows zuverlässig in Produktion betreiben lässt — Retrieval, Memory, Agenten, Observability, Eval und Sicherheits-Rails.
Eval-Harness
Eine Eval-Harness ist ein deterministisches Test-Apparat für ein nicht-deterministisches System: ein fixer Fixture-Datensatz, geschriebene Rubriken und ein Scoring-Lauf, der eine zwischen Releases vergleichbare Zahl liefert.
Regression Gate
Ein Regression Gate ist ein automatischer CI-Check, der die Eval-Scores des aktuellen Laufs gegen eine gespeicherte Baseline vergleicht und den PR sperrt, wenn eine Metrik die Toleranz überschreitet.
RAG (Retrieval-Augmented Generation)
RAG ist das Muster, bei dem zur Abfragezeit relevanter Kontext aus einer Wissensbasis geholt und in den Modell-Prompt eingefügt wird — so antwortet das Modell aus Ihren Daten, ohne neu trainiert werden zu müssen.
Model Context Protocol (MCP)
Das Model Context Protocol ist ein offener Standard, mit dem KI-Agenten Tools entdecken und aufrufen, Ressourcen lesen und Prompts von externen Servern nutzen können — der interoperable Stecker, um Agenten an Systeme anzuschliessen, die sie nicht nativ kennen.
Agent Tool Use
Agent Tool Use ist das Muster, bei dem einem Sprachmodell ein Satz typisierter Funktionen zur Verfügung gestellt wird — Suche, Datenbank-Queries, Code-Execution, API-Aufrufe — und die Runtime die Aufrufe ausführt und Ergebnisse zurückspeist, damit der Agent in realen Systemen agieren kann.
LLM-Guardrails
LLM-Guardrails sind die deterministische Schicht um ein Modell, die durchsetzt, was es nicht tun darf — Input-Validierung, Content-Filter, Refusal-Handling, Schema-Enforcement, Rate-Limits, Tool-Autorisierung — damit das System als Ganzes vorhersagbar fehlschlägt.
Vektor-Index
Ein Vektor-Index ist die Datenstruktur, die semantische Suche schnell macht — er speichert Embedding-Vektoren mit Approximate-Nearest-Neighbour-Lookups und liefert die top-K ähnlichsten Items in Millisekunden über Millionen von Datensätzen.
Strukturierte Ausgabe
Strukturierte Ausgabe ist der Modus, in dem ein Sprachmodell einen Wert zurückgibt, der einem deklarierten Schema entspricht — JSON, ein Tool-Aufruf oder ein typisiertes Objekt — statt freiem Text, durchgesetzt durch grammar-constrained Decoding des Anbieters.
Prompt Injection
Prompt Injection ist eine Angriffsklasse, bei der adversarieller Inhalt im Modell-Input — direkt vom Nutzer oder indirekt über ein abgerufenes Dokument, ein Bild oder eine Webseite — den System-Prompt überschreibt und das Modell zu etwas umleitet, das der Betreiber nicht beabsichtigt hat.
Observability-Traces
Observability-Traces sind die Pro-Anfrage-Aufzeichnung jedes Schrittes, den ein KI-System unternommen hat — Modellaufrufe, Tool-Aufrufe, Retrieval-Queries, Latenzen, Token-Counts — automatisch erfasst und für Replay, Debugging und Regressionsanalyse gespeichert.
Agent-Handoff
Ein Agent-Handoff ist die strukturierte Übergabe von Arbeit zwischen zwei KI-Agenten — ein Planer an einen Executor, ein Router an einen Spezialisten — codiert als typisierter Kontrakt mit explizitem Input, erwartetem Output und Erfolgskriterium.
Retrieval-Rerank
Retrieval-Rerank ist der zweite Pass über die top-K-Passagen, die von der Vektor-Suche zurückgegeben werden — ein kleines Cross-Encoder-Modell bewertet jedes (Anfrage, Passage)-Paar direkt und sortiert neu, damit die relevantesten Chunks zuerst zum Modell gelangen.
KI-Observability
KI-Observability ist die Schicht, die jeden Prompt, jeden Retrieval-Aufruf, jeden Tool-Call und jede Modell-Antwort in einem produktiven KI-System aufzeichnet, indiziert und replay-fähig macht — damit Operatoren einen einzelnen fehlerhaften Output debuggen, eine Aufsichtsfrage beantworten oder Drift über Wochen messen können.
Multi-Agent-Workflow
Ein Multi-Agent-Workflow ist ein produktives KI-System, in dem mehrere rollen-spezifische Agenten (jeder mit eigenen Tools und eigener Rubrik) sich über eine Aufgabe koordinieren — ein einzelner brüchiger Prompt wird durch ein kleines Team von Spezialisten ersetzt, die jeder eine Sache gut machen.
Embedding-Modell
Ein Embedding-Modell konvertiert Text, Bilder oder andere Daten in einen hochdimensionalen numerischen Vektor — semantisch ähnliche Inputs landen nah beieinander im Raum, und ein System kann «was bedeutet das» fragen statt «matcht dieser String».
Semantische Suche
Semantische Suche gibt Resultate zurück, die der Bedeutung einer Anfrage entsprechen statt ihrer wörtlichen Wörter — angetrieben von Embedding-Vektoren, Query-Rewriting und Reranking unter der Haube.
Vektor-Datenbank
Eine Vektor-Datenbank speichert Text und andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz — das Substrat unter Retrieval-Augmented Generation, semantischer Suche und Recommendation-Systemen.
Fine-Tuning
Fine-Tuning ist die Praxis, ein vortrainiertes Modell zu nehmen und sein Training auf einem kleineren task-spezifischen Datensatz fortzusetzen — die Gewichte verschieben sich in Richtung der Muster einer Domäne statt des allgemeinen Internets.
Halluzination
Eine KI-Halluzination ist eine selbstbewusst produzierte Aussage, die keine Grundlage im Input oder in irgendeiner abrufbaren Quelle hat — der Failure-Mode, der Sprach-Modelle von Datenbanken trennt, und derjenige, gegen den produktive KI sich verteidigen muss.
Chain-of-Thought
Chain-of-Thought ist ein Prompting- und Trainings-Muster, das ein LLM bittet, seine Zwischen-Reasoning-Schritte vor der finalen Antwort auszuschreiben — mehr Tokens gegen höhere Genauigkeit bei Aufgaben, wo die Schritte zählen.
Function Calling
Function Calling ist das API-Muster, bei dem ein LLM ein strukturiertes JSON-Payload zurückgibt, das anfordert, eine benannte Funktion mit spezifischen Argumenten aufzurufen — damit das Modell auf externen Systemen handeln kann, statt nur Text zu emittieren.
Agentic Search
Agentic Search ist die dritte Welle der Discoverability — KI-Agenten browsen das Web im Auftrag eines Nutzers, lesen strukturierte Manifeste wie /mcp-actions.json und schliessen Aufgaben direkt auf Sites ab, die maschinen-aufrufbare Aktionen exponieren, oft unter Umgehung der visuellen UI.
Embedding-Raum
Der Embedding-Raum ist die hochdimensionale Vektor-Geometrie, in die ein Embedding-Modell Text platziert — semantisch ähnliche Passagen landen nah beieinander, und Distanz ist der Proxy für Relevanz.
Context-Window
Das Context-Window ist die maximale Anzahl Tokens, die ein Sprach-Modell in einem einzelnen Call lesen und reasonen kann — die obere Grenze für System-Prompt + Konversations-Historie + retrievter Kontext + Output zusammen.
Prompt Engineering
Prompt Engineering ist die Disziplin, Instruktionen an ein Sprach-Modell so zu strukturieren, dass Outputs zuverlässig, gescopt und on-task sind — versioniert neben dem Rest des Systems, nicht im Chat-Fenster improvisiert.
Vektor-Suche
Vektor-Suche retrievt die Records, die einer Anfrage semantisch am ähnlichsten sind, indem sie ihre Embedding-Vektoren im hochdimensionalen Raum vergleicht — statt Keywords zu matchen.
Token-Budget
Das Token-Budget ist das deklarierte Maximum an Tokens, das ein KI-Workflow pro Request verbrauchen darf — für Prompt, retrievten Kontext, das Reasoning des Modells und den Output zusammen — zur Laufzeit erzwungen, damit Kosten und Latenz vorhersehbar bleiben.
Semantischer Cache
Ein semantischer Cache speichert vergangene Prompt-Antwort-Paare und bedient neue Requests aus dem Cache, wenn das Embedding des neuen Requests einem gespeicherten ausreichend nahe ist — sodass ein KI-Workflow den Modellaufruf für near-duplicate Anfragen komplett überspringt.
Faithfulness
Faithfulness ist die Eval-Metrik, die misst, ob jeder Claim in der Antwort eines Modells aus dem retrievten Kontext ableitbar ist — der kanonische Anti-Halluzinations-Check für jeden RAG-Workflow.
Cross-Encoder
Ein Cross-Encoder ist eine Modell-Architektur, die Anfrage und Kandidaten-Passage als einzigen joint Input nimmt und einen Relevanz-Score produziert — langsamer als Bi-Encoder-Embedding-Lookup, aber zehn bis zwanzig Punkte genauer.
Modell-Router
Ein Modell-Router ist ein kleiner Klassifikator, der jede eingehende Anfrage inspiziert und sie an das richtige Spezialisten-Modell oder den richtigen Workflow dispatched — klein/schnell für einfache Anfragen, gross/teuer nur, wenn die Aufgabe es verlangt.
KI-Kostenkontrolle
KI-Kostenkontrolle ist die Disziplin, Per-Workflow-Spend auf Sprach-Modell-APIs zu budgetieren, zu messen und zu erzwingen — Token-Budgets, Routing, Caching, Prompt-Caching und Gateway-Level-Limits kombiniert zu einer vorhersehbaren Kosten-Decke.
Modell-Destillation
Modell-Destillation ist die Praxis, ein kleineres Modell (den Schüler) so zu trainieren, dass es das Verhalten eines grösseren Modells (des Lehrers) auf einer spezifischen Aufgabe imitiert — ein kleiner Qualitätsverlust gegen substantielle Kosten- und Latenz-Reduktion.
Safety-Rails
Safety-Rails sind die deterministischen Guards, die um ein KI-System geschichtet werden — Input-Validierung, Content-Filterung, Refusal-Handler, Output-Schema-Enforcement, Rate-Limiting —, damit das Modell vorhersehbar scheitert, selbst wenn es sonst seltsam scheitern würde.
KI-Agent
Ein KI-Agent ist ein zielgerichtetes Software-System, das ein LLM nutzt, um zu planen, Tools aufzurufen und über mehrere Schritte hinweg zu handeln — mit messbaren Outputs, die bewertet werden können, bevor sie einen Nutzer erreichen.
CRM-Intelligenz
CRM-Intelligenz ist die KI-getriebene Schicht, die Daten in einem CRM anreichert, draftet und auf sie agiert — sie ersetzt das passive Record-System durch aktive Agenten, die Signale scoren, nächste Moves vorschlagen und Deals zur Oberfläche bringen, bevor sie verstummen.
Document Intelligence
Document Intelligence ist die KI-Schicht, die unstrukturierte Dokumente, auf denen ein Unternehmen läuft, liest, extrahiert, klassifiziert und routet — sie ersetzt manuelle Triage von Verträgen, Rechnungen, Briefings und E-Mails durch messbare Extraktion und strukturierte Downstream-Aktionen.
Eval-Driven KI
Eval-Driven KI ist eine Entwicklungs-Disziplin, die die Evaluations-Harness vor dem Agenten schreibt, jeden Output gegen eine versionierte Rubrik scored und nur auf grünen Metriken shippt — das KI-Äquivalent dazu, Integrationstests vor einem Feature zu schreiben.
Discovery Sprint
Ein Discovery Sprint ist ein fokussiertes zweiwöchiges Engagement, das die riskanteste Annahme hinter einer Software-, KI- oder Plattform-Idee mit laufendem Code validiert — und am Ende ein Build-or-Don't-Verdict liefert, beide Outcomes das Engagement wert.
Digital Operating Layer
Eine Digital Operating Layer ist das verbundene System, das ein modernes Unternehmen über seine Oberflächen betreibt — das sichtbare Interface, die Daten dahinter, die KI-Workflows, die es bewegen, und die Dashboards, die es erklären — designed als ein Stack statt fünf disconnected Tools.
Immersive Website
Eine Immersive Website ist eine digitale Oberfläche, die sich wie ein kohärenter Raum anfühlt statt wie ein Stapel Seiten — Pacing, Motion, Materialität, Typografie und editorialer Rhythmus zusammen getunt, sodass der Besucher durch eine Atmosphäre statt durch ein Layout bewegt wird.
Hospitality-Website
Eine Hospitality-Website ist die digitale Schaufront eines Venues — Bar, Restaurant, Hotel oder Destination — designed, um Atmosphäre in Reservationen, Events und wiederkehrende Gäste zu verwandeln, mit Reservationen, Öffnungszeiten, Galerie und operationalen Systemen verdrahtet.
Marktplatz-Plattform
Eine Marktplatz-Plattform ist ein zweiseitiges Software-System, das eine Nachfrage-Seite (Anfrager, Käufer, Organisatoren) mit einer Angebots-Seite (Betreiber, Verkäufer, Venues) über eine Matching-Schicht, ein Operator-Dashboard und ein Trust-System verbindet — designed, um Anfragen über die Lücke zu bewegen.
Business Intelligence Dashboard
Ein Business Intelligence Dashboard ist eine Echtzeit-Entscheidungs-Oberfläche, die operationale Daten in eine kleine Anzahl sichtbarer Signale verwandelt, auf die Operatoren handeln können — sie ersetzt Wochen-Reports durch kontinuierliches Bewusstsein.
Echtzeit-Dashboard
Ein Echtzeit-Dashboard ist eine Live-Daten-Oberfläche, die sich innerhalb von Sekunden des zugrunde liegenden Events aktualisiert — designed für Operatoren, die kontinuierliches Bewusstsein darüber brauchen, was sich im Unternehmen ändert, nicht einen Wochen-Snapshot.
Kunden-Portal
Ein Kunden-Portal ist eine private digitale Oberfläche, wo ein Service-Business und seine Kunden das Engagement gemeinsam betreiben — sie ersetzt verstreute E-Mail-Threads durch eine Single-Source-of-Truth für Projekte, Files, Entscheidungen und Zahlungen.
Agent-Memory
Agent-Memory ist der persistente State, den ein KI-Agent zu Beginn jeder Runde liest und am Ende zurückschreibt — der Unterschied zwischen einem Agent, der einen Nutzer über eine Konversation lernt, und einem, der jedes Mal kalt startet.
Strukturierte Extraktion
Strukturierte Extraktion ist der KI-Workflow, der unstrukturierten Text in ein typisiertes Objekt verwandelt, das einem strikten Schema entspricht — die Brücke zwischen frei-formatigen Dokumenten und dem Rest des Produktions-Stacks.
KI-Evaluations-Framework
Ein KI-Evaluations-Framework ist die Disziplin-Schicht über jeder einzelnen Eval-Harness — das Set von Fixtures, Rubriken, Regressions-Policies und Release-Gates, das regelt, wie ein KI-System über alle Workflows und über Zeit gemessen wird.
Retrieval-Qualität
Retrieval-Qualität ist die Familie von Metriken, die misst, ob eine RAG-Pipeline tatsächlich den richtigen Kontext für die Anfrage zur Oberfläche bringt — Recall@k, Precision@k, MRR, nDCG — gemessen gegen ein gelabeltes Fixture-Set, nicht Vibes.
KI-Guardrail-Policy
Eine KI-Guardrail-Policy ist die geschriebene Spezifikation dessen, was ein KI-System verweigern, validieren und eskalieren muss — das Policy-Dokument, das der deterministische Guardrail-Code durchsetzt und die Eval-Harness testet.
Eval-Fixture
Eine Eval-Fixture ist ein Input-und-erwartete-Form-Paar in einer Evaluations-Harness — ein realer oder repräsentativer Beispiel mit der gelabelten Antwort oder dem Rubrik-Outcome, den der KI-Workflow produzieren soll.
Eval-Rubrik
Eine Eval-Rubrik ist die geschriebene Definition dessen, was als guter Output für eine Input-Klasse zählt — der Scoring-Kontrakt, der subjektives Urteil in eine Zahl verwandelt, die eine Eval-Harness über Releases vergleichen kann.
KI-Incident
Ein KI-Incident ist ein Produktions-Failure eines KI-Systems, der ernst genug ist, um eine strukturierte Response zu rechtfertigen — schlechter Output, der einen Nutzer erreichte, eine Regression, die ein Release-Gate sprengte, eine regulatorische Exposition oder ein Runaway-Cost-Event.
Agent-Orchestrierung
Agent-Orchestrierung ist die Kontroll-Schicht, die Arbeit zwischen benannten Agenten routet, Reihenfolge erzwingt, Retries verwaltet und den State des Runs zur Oberfläche bringt — das System, das mehrere rollen-gescopte Agenten zu einem produktiven Workflow macht.
Eval-Versionierung
Eval-Versionierung ist die Disziplin, das Fixture-Set, die Rubrik und die Regressions-Baseline als versionierte Artefakte in Git zu behandeln — sodass jedes Scoreboard mit dem vorherigen vergleichbar ist und jedes Drift auf eine spezifische Änderung zurückverfolgbar ist.
Modell-Fallback
Modell-Fallback ist das produktive Muster, zu einem sekundären Modell zu routen, wenn das primäre scheitert, verweigert oder ein Budget verletzt — sodass eine einzelne Provider-Ausfall oder ein einzelner transienter Fehler den Workflow nicht zum Stillstand bringt.
Fein-granulares Routing
Fein-granulares Routing ist das produktive Muster, unterschiedliche Teile desselben Workflows an unterschiedliche Modelle zu dispatchen — klein/schnell für günstige Schritte, gross/teuer nur für die Schritte, die es brauchen — sodass die Kosten-Verteilung der Schwierigkeits-Verteilung entspricht.
KI-Policy-Versionskontrolle
KI-Policy-Versionskontrolle ist die Praxis, die KI-Guardrail-Policy in Git zu speichern, Änderungen durch PRs zu reviewen und jedes Produktions-Release auf eine spezifische Policy-Version zu pinnen — sodass jede Entscheidung, die das System macht, zur Policy zurückverfolgbar ist, unter der es operierte.