Skip to content

Glossar · Klare Definitionen

Das Morvion-Vokabular.

Kurze, klare Definitionen der Begriffe, gegen die wir ausliefern, geschrieben für Operatoren, die lieber wissen wollen, was etwas bedeutet, als dass es ihnen verkauft wird. Jeder Eintrag enthält einen Einzeiler, eine längere Erklärung und die Fragen, die uns am häufigsten gestellt werden.

Die deutsche Fassung deckt jetzt alle 60 Einträge ab — eins-zu-eins mit der englischsprachigen Glossar-Seite. Schweizer Hochdeutsch, mit den englischen Fachbegriffen dort, wo Engineers im DACH-Raum sie tatsächlich nutzen.

  1. KI-Infrastruktur

    KI-Infrastruktur ist die technische und architektonische Schicht, die ein Unternehmen KI-gesteuerte Workflows zuverlässig in Produktion betreiben lässt — Retrieval, Memory, Agenten, Observability, Eval und Sicherheits-Rails.

  2. Eval-Harness

    Eine Eval-Harness ist ein deterministisches Test-Apparat für ein nicht-deterministisches System: ein fixer Fixture-Datensatz, geschriebene Rubriken und ein Scoring-Lauf, der eine zwischen Releases vergleichbare Zahl liefert.

  3. Regression Gate

    Ein Regression Gate ist ein automatischer CI-Check, der die Eval-Scores des aktuellen Laufs gegen eine gespeicherte Baseline vergleicht und den PR sperrt, wenn eine Metrik die Toleranz überschreitet.

  4. RAG (Retrieval-Augmented Generation)

    RAG ist das Muster, bei dem zur Abfragezeit relevanter Kontext aus einer Wissensbasis geholt und in den Modell-Prompt eingefügt wird — so antwortet das Modell aus Ihren Daten, ohne neu trainiert werden zu müssen.

  5. Model Context Protocol (MCP)

    Das Model Context Protocol ist ein offener Standard, mit dem KI-Agenten Tools entdecken und aufrufen, Ressourcen lesen und Prompts von externen Servern nutzen können — der interoperable Stecker, um Agenten an Systeme anzuschliessen, die sie nicht nativ kennen.

  6. Agent Tool Use

    Agent Tool Use ist das Muster, bei dem einem Sprachmodell ein Satz typisierter Funktionen zur Verfügung gestellt wird — Suche, Datenbank-Queries, Code-Execution, API-Aufrufe — und die Runtime die Aufrufe ausführt und Ergebnisse zurückspeist, damit der Agent in realen Systemen agieren kann.

  7. LLM-Guardrails

    LLM-Guardrails sind die deterministische Schicht um ein Modell, die durchsetzt, was es nicht tun darf — Input-Validierung, Content-Filter, Refusal-Handling, Schema-Enforcement, Rate-Limits, Tool-Autorisierung — damit das System als Ganzes vorhersagbar fehlschlägt.

  8. Vektor-Index

    Ein Vektor-Index ist die Datenstruktur, die semantische Suche schnell macht — er speichert Embedding-Vektoren mit Approximate-Nearest-Neighbour-Lookups und liefert die top-K ähnlichsten Items in Millisekunden über Millionen von Datensätzen.

  9. Strukturierte Ausgabe

    Strukturierte Ausgabe ist der Modus, in dem ein Sprachmodell einen Wert zurückgibt, der einem deklarierten Schema entspricht — JSON, ein Tool-Aufruf oder ein typisiertes Objekt — statt freiem Text, durchgesetzt durch grammar-constrained Decoding des Anbieters.

  10. Prompt Injection

    Prompt Injection ist eine Angriffsklasse, bei der adversarieller Inhalt im Modell-Input — direkt vom Nutzer oder indirekt über ein abgerufenes Dokument, ein Bild oder eine Webseite — den System-Prompt überschreibt und das Modell zu etwas umleitet, das der Betreiber nicht beabsichtigt hat.

  11. Observability-Traces

    Observability-Traces sind die Pro-Anfrage-Aufzeichnung jedes Schrittes, den ein KI-System unternommen hat — Modellaufrufe, Tool-Aufrufe, Retrieval-Queries, Latenzen, Token-Counts — automatisch erfasst und für Replay, Debugging und Regressionsanalyse gespeichert.

  12. Agent-Handoff

    Ein Agent-Handoff ist die strukturierte Übergabe von Arbeit zwischen zwei KI-Agenten — ein Planer an einen Executor, ein Router an einen Spezialisten — codiert als typisierter Kontrakt mit explizitem Input, erwartetem Output und Erfolgskriterium.

  13. Retrieval-Rerank

    Retrieval-Rerank ist der zweite Pass über die top-K-Passagen, die von der Vektor-Suche zurückgegeben werden — ein kleines Cross-Encoder-Modell bewertet jedes (Anfrage, Passage)-Paar direkt und sortiert neu, damit die relevantesten Chunks zuerst zum Modell gelangen.

  14. KI-Observability

    KI-Observability ist die Schicht, die jeden Prompt, jeden Retrieval-Aufruf, jeden Tool-Call und jede Modell-Antwort in einem produktiven KI-System aufzeichnet, indiziert und replay-fähig macht — damit Operatoren einen einzelnen fehlerhaften Output debuggen, eine Aufsichtsfrage beantworten oder Drift über Wochen messen können.

  15. Multi-Agent-Workflow

    Ein Multi-Agent-Workflow ist ein produktives KI-System, in dem mehrere rollen-spezifische Agenten (jeder mit eigenen Tools und eigener Rubrik) sich über eine Aufgabe koordinieren — ein einzelner brüchiger Prompt wird durch ein kleines Team von Spezialisten ersetzt, die jeder eine Sache gut machen.

  16. Embedding-Modell

    Ein Embedding-Modell konvertiert Text, Bilder oder andere Daten in einen hochdimensionalen numerischen Vektor — semantisch ähnliche Inputs landen nah beieinander im Raum, und ein System kann «was bedeutet das» fragen statt «matcht dieser String».

  17. Semantische Suche

    Semantische Suche gibt Resultate zurück, die der Bedeutung einer Anfrage entsprechen statt ihrer wörtlichen Wörter — angetrieben von Embedding-Vektoren, Query-Rewriting und Reranking unter der Haube.

  18. Vektor-Datenbank

    Eine Vektor-Datenbank speichert Text und andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz — das Substrat unter Retrieval-Augmented Generation, semantischer Suche und Recommendation-Systemen.

  19. Fine-Tuning

    Fine-Tuning ist die Praxis, ein vortrainiertes Modell zu nehmen und sein Training auf einem kleineren task-spezifischen Datensatz fortzusetzen — die Gewichte verschieben sich in Richtung der Muster einer Domäne statt des allgemeinen Internets.

  20. Halluzination

    Eine KI-Halluzination ist eine selbstbewusst produzierte Aussage, die keine Grundlage im Input oder in irgendeiner abrufbaren Quelle hat — der Failure-Mode, der Sprach-Modelle von Datenbanken trennt, und derjenige, gegen den produktive KI sich verteidigen muss.

  21. Chain-of-Thought

    Chain-of-Thought ist ein Prompting- und Trainings-Muster, das ein LLM bittet, seine Zwischen-Reasoning-Schritte vor der finalen Antwort auszuschreiben — mehr Tokens gegen höhere Genauigkeit bei Aufgaben, wo die Schritte zählen.

  22. Function Calling

    Function Calling ist das API-Muster, bei dem ein LLM ein strukturiertes JSON-Payload zurückgibt, das anfordert, eine benannte Funktion mit spezifischen Argumenten aufzurufen — damit das Modell auf externen Systemen handeln kann, statt nur Text zu emittieren.

  23. Agentic Search

    Agentic Search ist die dritte Welle der Discoverability — KI-Agenten browsen das Web im Auftrag eines Nutzers, lesen strukturierte Manifeste wie /mcp-actions.json und schliessen Aufgaben direkt auf Sites ab, die maschinen-aufrufbare Aktionen exponieren, oft unter Umgehung der visuellen UI.

  24. Embedding-Raum

    Der Embedding-Raum ist die hochdimensionale Vektor-Geometrie, in die ein Embedding-Modell Text platziert — semantisch ähnliche Passagen landen nah beieinander, und Distanz ist der Proxy für Relevanz.

  25. Context-Window

    Das Context-Window ist die maximale Anzahl Tokens, die ein Sprach-Modell in einem einzelnen Call lesen und reasonen kann — die obere Grenze für System-Prompt + Konversations-Historie + retrievter Kontext + Output zusammen.

  26. Prompt Engineering

    Prompt Engineering ist die Disziplin, Instruktionen an ein Sprach-Modell so zu strukturieren, dass Outputs zuverlässig, gescopt und on-task sind — versioniert neben dem Rest des Systems, nicht im Chat-Fenster improvisiert.

  27. Vektor-Suche

    Vektor-Suche retrievt die Records, die einer Anfrage semantisch am ähnlichsten sind, indem sie ihre Embedding-Vektoren im hochdimensionalen Raum vergleicht — statt Keywords zu matchen.

  28. Token-Budget

    Das Token-Budget ist das deklarierte Maximum an Tokens, das ein KI-Workflow pro Request verbrauchen darf — für Prompt, retrievten Kontext, das Reasoning des Modells und den Output zusammen — zur Laufzeit erzwungen, damit Kosten und Latenz vorhersehbar bleiben.

  29. Semantischer Cache

    Ein semantischer Cache speichert vergangene Prompt-Antwort-Paare und bedient neue Requests aus dem Cache, wenn das Embedding des neuen Requests einem gespeicherten ausreichend nahe ist — sodass ein KI-Workflow den Modellaufruf für near-duplicate Anfragen komplett überspringt.

  30. Faithfulness

    Faithfulness ist die Eval-Metrik, die misst, ob jeder Claim in der Antwort eines Modells aus dem retrievten Kontext ableitbar ist — der kanonische Anti-Halluzinations-Check für jeden RAG-Workflow.

  31. Cross-Encoder

    Ein Cross-Encoder ist eine Modell-Architektur, die Anfrage und Kandidaten-Passage als einzigen joint Input nimmt und einen Relevanz-Score produziert — langsamer als Bi-Encoder-Embedding-Lookup, aber zehn bis zwanzig Punkte genauer.

  32. Modell-Router

    Ein Modell-Router ist ein kleiner Klassifikator, der jede eingehende Anfrage inspiziert und sie an das richtige Spezialisten-Modell oder den richtigen Workflow dispatched — klein/schnell für einfache Anfragen, gross/teuer nur, wenn die Aufgabe es verlangt.

  33. KI-Kostenkontrolle

    KI-Kostenkontrolle ist die Disziplin, Per-Workflow-Spend auf Sprach-Modell-APIs zu budgetieren, zu messen und zu erzwingen — Token-Budgets, Routing, Caching, Prompt-Caching und Gateway-Level-Limits kombiniert zu einer vorhersehbaren Kosten-Decke.

  34. Modell-Destillation

    Modell-Destillation ist die Praxis, ein kleineres Modell (den Schüler) so zu trainieren, dass es das Verhalten eines grösseren Modells (des Lehrers) auf einer spezifischen Aufgabe imitiert — ein kleiner Qualitätsverlust gegen substantielle Kosten- und Latenz-Reduktion.

  35. Safety-Rails

    Safety-Rails sind die deterministischen Guards, die um ein KI-System geschichtet werden — Input-Validierung, Content-Filterung, Refusal-Handler, Output-Schema-Enforcement, Rate-Limiting —, damit das Modell vorhersehbar scheitert, selbst wenn es sonst seltsam scheitern würde.

  36. KI-Agent

    Ein KI-Agent ist ein zielgerichtetes Software-System, das ein LLM nutzt, um zu planen, Tools aufzurufen und über mehrere Schritte hinweg zu handeln — mit messbaren Outputs, die bewertet werden können, bevor sie einen Nutzer erreichen.

  37. CRM-Intelligenz

    CRM-Intelligenz ist die KI-getriebene Schicht, die Daten in einem CRM anreichert, draftet und auf sie agiert — sie ersetzt das passive Record-System durch aktive Agenten, die Signale scoren, nächste Moves vorschlagen und Deals zur Oberfläche bringen, bevor sie verstummen.

  38. Document Intelligence

    Document Intelligence ist die KI-Schicht, die unstrukturierte Dokumente, auf denen ein Unternehmen läuft, liest, extrahiert, klassifiziert und routet — sie ersetzt manuelle Triage von Verträgen, Rechnungen, Briefings und E-Mails durch messbare Extraktion und strukturierte Downstream-Aktionen.

  39. Eval-Driven KI

    Eval-Driven KI ist eine Entwicklungs-Disziplin, die die Evaluations-Harness vor dem Agenten schreibt, jeden Output gegen eine versionierte Rubrik scored und nur auf grünen Metriken shippt — das KI-Äquivalent dazu, Integrationstests vor einem Feature zu schreiben.

  40. Discovery Sprint

    Ein Discovery Sprint ist ein fokussiertes zweiwöchiges Engagement, das die riskanteste Annahme hinter einer Software-, KI- oder Plattform-Idee mit laufendem Code validiert — und am Ende ein Build-or-Don't-Verdict liefert, beide Outcomes das Engagement wert.

  41. Digital Operating Layer

    Eine Digital Operating Layer ist das verbundene System, das ein modernes Unternehmen über seine Oberflächen betreibt — das sichtbare Interface, die Daten dahinter, die KI-Workflows, die es bewegen, und die Dashboards, die es erklären — designed als ein Stack statt fünf disconnected Tools.

  42. Immersive Website

    Eine Immersive Website ist eine digitale Oberfläche, die sich wie ein kohärenter Raum anfühlt statt wie ein Stapel Seiten — Pacing, Motion, Materialität, Typografie und editorialer Rhythmus zusammen getunt, sodass der Besucher durch eine Atmosphäre statt durch ein Layout bewegt wird.

  43. Hospitality-Website

    Eine Hospitality-Website ist die digitale Schaufront eines Venues — Bar, Restaurant, Hotel oder Destination — designed, um Atmosphäre in Reservationen, Events und wiederkehrende Gäste zu verwandeln, mit Reservationen, Öffnungszeiten, Galerie und operationalen Systemen verdrahtet.

  44. Marktplatz-Plattform

    Eine Marktplatz-Plattform ist ein zweiseitiges Software-System, das eine Nachfrage-Seite (Anfrager, Käufer, Organisatoren) mit einer Angebots-Seite (Betreiber, Verkäufer, Venues) über eine Matching-Schicht, ein Operator-Dashboard und ein Trust-System verbindet — designed, um Anfragen über die Lücke zu bewegen.

  45. Business Intelligence Dashboard

    Ein Business Intelligence Dashboard ist eine Echtzeit-Entscheidungs-Oberfläche, die operationale Daten in eine kleine Anzahl sichtbarer Signale verwandelt, auf die Operatoren handeln können — sie ersetzt Wochen-Reports durch kontinuierliches Bewusstsein.

  46. Echtzeit-Dashboard

    Ein Echtzeit-Dashboard ist eine Live-Daten-Oberfläche, die sich innerhalb von Sekunden des zugrunde liegenden Events aktualisiert — designed für Operatoren, die kontinuierliches Bewusstsein darüber brauchen, was sich im Unternehmen ändert, nicht einen Wochen-Snapshot.

  47. Kunden-Portal

    Ein Kunden-Portal ist eine private digitale Oberfläche, wo ein Service-Business und seine Kunden das Engagement gemeinsam betreiben — sie ersetzt verstreute E-Mail-Threads durch eine Single-Source-of-Truth für Projekte, Files, Entscheidungen und Zahlungen.

  48. Agent-Memory

    Agent-Memory ist der persistente State, den ein KI-Agent zu Beginn jeder Runde liest und am Ende zurückschreibt — der Unterschied zwischen einem Agent, der einen Nutzer über eine Konversation lernt, und einem, der jedes Mal kalt startet.

  49. Strukturierte Extraktion

    Strukturierte Extraktion ist der KI-Workflow, der unstrukturierten Text in ein typisiertes Objekt verwandelt, das einem strikten Schema entspricht — die Brücke zwischen frei-formatigen Dokumenten und dem Rest des Produktions-Stacks.

  50. KI-Evaluations-Framework

    Ein KI-Evaluations-Framework ist die Disziplin-Schicht über jeder einzelnen Eval-Harness — das Set von Fixtures, Rubriken, Regressions-Policies und Release-Gates, das regelt, wie ein KI-System über alle Workflows und über Zeit gemessen wird.

  51. Retrieval-Qualität

    Retrieval-Qualität ist die Familie von Metriken, die misst, ob eine RAG-Pipeline tatsächlich den richtigen Kontext für die Anfrage zur Oberfläche bringt — Recall@k, Precision@k, MRR, nDCG — gemessen gegen ein gelabeltes Fixture-Set, nicht Vibes.

  52. KI-Guardrail-Policy

    Eine KI-Guardrail-Policy ist die geschriebene Spezifikation dessen, was ein KI-System verweigern, validieren und eskalieren muss — das Policy-Dokument, das der deterministische Guardrail-Code durchsetzt und die Eval-Harness testet.

  53. Eval-Fixture

    Eine Eval-Fixture ist ein Input-und-erwartete-Form-Paar in einer Evaluations-Harness — ein realer oder repräsentativer Beispiel mit der gelabelten Antwort oder dem Rubrik-Outcome, den der KI-Workflow produzieren soll.

  54. Eval-Rubrik

    Eine Eval-Rubrik ist die geschriebene Definition dessen, was als guter Output für eine Input-Klasse zählt — der Scoring-Kontrakt, der subjektives Urteil in eine Zahl verwandelt, die eine Eval-Harness über Releases vergleichen kann.

  55. KI-Incident

    Ein KI-Incident ist ein Produktions-Failure eines KI-Systems, der ernst genug ist, um eine strukturierte Response zu rechtfertigen — schlechter Output, der einen Nutzer erreichte, eine Regression, die ein Release-Gate sprengte, eine regulatorische Exposition oder ein Runaway-Cost-Event.

  56. Agent-Orchestrierung

    Agent-Orchestrierung ist die Kontroll-Schicht, die Arbeit zwischen benannten Agenten routet, Reihenfolge erzwingt, Retries verwaltet und den State des Runs zur Oberfläche bringt — das System, das mehrere rollen-gescopte Agenten zu einem produktiven Workflow macht.

  57. Eval-Versionierung

    Eval-Versionierung ist die Disziplin, das Fixture-Set, die Rubrik und die Regressions-Baseline als versionierte Artefakte in Git zu behandeln — sodass jedes Scoreboard mit dem vorherigen vergleichbar ist und jedes Drift auf eine spezifische Änderung zurückverfolgbar ist.

  58. Modell-Fallback

    Modell-Fallback ist das produktive Muster, zu einem sekundären Modell zu routen, wenn das primäre scheitert, verweigert oder ein Budget verletzt — sodass eine einzelne Provider-Ausfall oder ein einzelner transienter Fehler den Workflow nicht zum Stillstand bringt.

  59. Fein-granulares Routing

    Fein-granulares Routing ist das produktive Muster, unterschiedliche Teile desselben Workflows an unterschiedliche Modelle zu dispatchen — klein/schnell für günstige Schritte, gross/teuer nur für die Schritte, die es brauchen — sodass die Kosten-Verteilung der Schwierigkeits-Verteilung entspricht.

  60. KI-Policy-Versionskontrolle

    KI-Policy-Versionskontrolle ist die Praxis, die KI-Guardrail-Policy in Git zu speichern, Änderungen durch PRs zu reviewen und jedes Produktions-Release auf eine spezifische Policy-Version zu pinnen — sodass jede Entscheidung, die das System macht, zur Policy zurückverfolgbar ist, unter der es operierte.