Was ist semantische Suche?

Semantische Suche ist ein Such-Erlebnis, das Resultate zurückgibt, die der Bedeutung einer Anfrage entsprechen, nicht den wörtlichen Wörtern. Sie ist gebaut auf Embedding-basiertem Vektor-Retrieval, Query Understanding, hybrider Keyword-Fusion und Reranking — damit Nutzer die richtige Antwort bekommen, auch wenn ihre Wörter und die Wörter des Katalogs unterschiedlich sind.

Wie unterscheidet sich semantische Suche von Keyword-Suche?

Keyword-Suche matcht Strings, semantische Suche matcht Bedeutungen. Produktive Systeme betreiben üblicherweise beides parallel und fusionieren die Resultate, weil jedes dort glänzt, wo das andere scheitert: semantisch auf Intent und Synonymie, Keyword auf exakten Identifiern und seltenen Namen.

Braucht semantische Suche ein LLM zur Query-Zeit?

Strikt nein. Der Embedding-Schritt braucht kein Chat-Modell. Aber die meisten modernen Semantic-Search-Systeme nutzen ein LLM für Query-Rewriting und Reranking, wo die Per-Query-Kosten durch den Accuracy-Lift gerechtfertigt sind.

Wo geht semantische Suche schief?

Bei exakten Identifiern (SKUs, Kontonummern), bei seltenen Named-Entities, die das Embedding-Modell nicht gesehen hat, und bei Anfragen mit harten Constraints, die das System als weiche Präferenzen behandelt. Hybrides Retrieval, strukturierte Metadaten und explizite Filter adressieren die meisten davon.

Semantische Suche · Morvion Glossar

Semantische Suche ist die nutzer-seitige Such-Fähigkeit, die Resultate zurückgibt, die der Bedeutung einer Anfrage entsprechen — nicht ihren wörtlichen Tokens. Der Kunde tippt «gemütliche Aperitivo-Location», das System gibt die Weinbar mit Live-Musik am See zurück, obwohl keines dieser Wörter im Suchfeld auftaucht.

Der Semantic-Search-Stack.

Query Understanding. Die Anfrage wird normalisiert, mit Synonymen expandiert oder von einem LLM umformuliert und mit Intent und Entitäten getaggt.
Vektor-Retrieval. Die umformulierte Anfrage wird embeddet und genutzt, um die top-K semantisch ähnlichen Records zu finden.
Hybride Fusion. Vektor-Resultate werden mit Keyword-Resultaten kombiniert (BM25 ist immer noch der Default-Keyword-Scorer) per Reciprocal Rank Fusion oder einem gelernten Mixer.
Reranking. Ein Zweitstufen-Modell (Cross-Encoder oder kleines LLM) bewertet die fusionierte Kandidatenliste gegen die Original-Anfrage auf Relevanz. Siehe Retrieval-Rerank.
Filterung und Gruppierung. Metadaten-Filter greifen (Tenant, Sprache, Datum), und Near-Duplicates werden gruppiert oder unterdrückt.

Warum semantische Suche Keyword-Suche schlägt.

Operatoren beschreiben ihre Erfahrung in ihren eigenen Worten, Kunden fragen in ihren. Keyword-Suche zwingt dem Kunden die Last auf, das Vokabular des Katalogs zu erraten. Semantische Suche legt diese Last aufs System, wo sie hingehört.

Wo semantische Suche schwächelt.

Exakte Identifier (SKUs, Kontonummern, ISBNs) und seltene Named-Entities sind dort, wo semantische Suche unter Keyword-Suche fällt; hybrides Retrieval mildert das. Sensible Domänen (juristisch, medizinisch) brauchen sorgfältiges Query Understanding und explizites Constraint-Handling, damit das System nicht beim Intent rät.

Häufige Fragen.

Was ist semantische Suche?: Semantische Suche ist ein Such-Erlebnis, das Resultate zurückgibt, die der Bedeutung einer Anfrage entsprechen, nicht den wörtlichen Wörtern. Sie ist gebaut auf Embedding-basiertem Vektor-Retrieval, Query Understanding, hybrider Keyword-Fusion und Reranking — damit Nutzer die richtige Antwort bekommen, auch wenn ihre Wörter und die Wörter des Katalogs unterschiedlich sind.
Wie unterscheidet sich semantische Suche von Keyword-Suche?: Keyword-Suche matcht Strings, semantische Suche matcht Bedeutungen. Produktive Systeme betreiben üblicherweise beides parallel und fusionieren die Resultate, weil jedes dort glänzt, wo das andere scheitert: semantisch auf Intent und Synonymie, Keyword auf exakten Identifiern und seltenen Namen.
Braucht semantische Suche ein LLM zur Query-Zeit?: Strikt nein. Der Embedding-Schritt braucht kein Chat-Modell. Aber die meisten modernen Semantic-Search-Systeme nutzen ein LLM für Query-Rewriting und Reranking, wo die Per-Query-Kosten durch den Accuracy-Lift gerechtfertigt sind.
Wo geht semantische Suche schief?: Bei exakten Identifiern (SKUs, Kontonummern), bei seltenen Named-Entities, die das Embedding-Modell nicht gesehen hat, und bei Anfragen mit harten Constraints, die das System als weiche Präferenzen behandelt. Hybrides Retrieval, strukturierte Metadaten und explizite Filter adressieren die meisten davon.

Englische Fassung: Semantische Suche on the EN edition.

Semantische Suche

Der Semantic-Search-Stack.

Warum semantische Suche Keyword-Suche schlägt.

Wo semantische Suche schwächelt.

Häufige Fragen.

Digitale Produkte & Plattformen

Weiter im Glossar.

KI-Infrastruktur

Eval-Harness

Regression Gate

RAG (Retrieval-Augmented Generation)

Model Context Protocol (MCP)

Agent Tool Use

LLM-Guardrails

Vektor-Index

Strukturierte Ausgabe

Prompt Injection

Observability-Traces

Agent-Handoff

Retrieval-Rerank

KI-Observability

Multi-Agent-Workflow

Embedding-Modell

Vektor-Datenbank

Fine-Tuning

Halluzination

Chain-of-Thought

Function Calling

Agentic Search

Embedding-Raum

Context-Window

Prompt Engineering

Vektor-Suche

Token-Budget

Semantischer Cache

Faithfulness

Cross-Encoder

Modell-Router

KI-Kostenkontrolle

Modell-Destillation

Safety-Rails

KI-Agent

CRM-Intelligenz

Document Intelligence

Eval-Driven KI

Discovery Sprint

Digital Operating Layer

Immersive Website

Hospitality-Website

Marktplatz-Plattform

Business Intelligence Dashboard

Echtzeit-Dashboard

Kunden-Portal

Agent-Memory

Strukturierte Extraktion

KI-Evaluations-Framework

Retrieval-Qualität

KI-Guardrail-Policy

Eval-Fixture

Eval-Rubrik

KI-Incident

Agent-Orchestrierung

Eval-Versionierung

Modell-Fallback

Fein-granulares Routing

KI-Policy-Versionskontrolle