Semantische Suche ist die nutzer-seitige Such-Fähigkeit, die Resultate zurückgibt, die der Bedeutung einer Anfrage entsprechen — nicht ihren wörtlichen Tokens. Der Kunde tippt «gemütliche Aperitivo-Location», das System gibt die Weinbar mit Live-Musik am See zurück, obwohl keines dieser Wörter im Suchfeld auftaucht.

Der Semantic-Search-Stack.

  1. Query Understanding. Die Anfrage wird normalisiert, mit Synonymen expandiert oder von einem LLM umformuliert und mit Intent und Entitäten getaggt.
  2. Vektor-Retrieval. Die umformulierte Anfrage wird embeddet und genutzt, um die top-K semantisch ähnlichen Records zu finden.
  3. Hybride Fusion. Vektor-Resultate werden mit Keyword-Resultaten kombiniert (BM25 ist immer noch der Default-Keyword-Scorer) per Reciprocal Rank Fusion oder einem gelernten Mixer.
  4. Reranking. Ein Zweitstufen-Modell (Cross-Encoder oder kleines LLM) bewertet die fusionierte Kandidatenliste gegen die Original-Anfrage auf Relevanz. Siehe Retrieval-Rerank.
  5. Filterung und Gruppierung. Metadaten-Filter greifen (Tenant, Sprache, Datum), und Near-Duplicates werden gruppiert oder unterdrückt.

Warum semantische Suche Keyword-Suche schlägt.

Operatoren beschreiben ihre Erfahrung in ihren eigenen Worten, Kunden fragen in ihren. Keyword-Suche zwingt dem Kunden die Last auf, das Vokabular des Katalogs zu erraten. Semantische Suche legt diese Last aufs System, wo sie hingehört.

Wo semantische Suche schwächelt.

Exakte Identifier (SKUs, Kontonummern, ISBNs) und seltene Named-Entities sind dort, wo semantische Suche unter Keyword-Suche fällt; hybrides Retrieval mildert das. Sensible Domänen (juristisch, medizinisch) brauchen sorgfältiges Query Understanding und explizites Constraint-Handling, damit das System nicht beim Intent rät.

Häufige Fragen.

Was ist semantische Suche?
Semantische Suche ist ein Such-Erlebnis, das Resultate zurückgibt, die der Bedeutung einer Anfrage entsprechen, nicht den wörtlichen Wörtern. Sie ist gebaut auf Embedding-basiertem Vektor-Retrieval, Query Understanding, hybrider Keyword-Fusion und Reranking — damit Nutzer die richtige Antwort bekommen, auch wenn ihre Wörter und die Wörter des Katalogs unterschiedlich sind.
Wie unterscheidet sich semantische Suche von Keyword-Suche?
Keyword-Suche matcht Strings, semantische Suche matcht Bedeutungen. Produktive Systeme betreiben üblicherweise beides parallel und fusionieren die Resultate, weil jedes dort glänzt, wo das andere scheitert: semantisch auf Intent und Synonymie, Keyword auf exakten Identifiern und seltenen Namen.
Braucht semantische Suche ein LLM zur Query-Zeit?
Strikt nein. Der Embedding-Schritt braucht kein Chat-Modell. Aber die meisten modernen Semantic-Search-Systeme nutzen ein LLM für Query-Rewriting und Reranking, wo die Per-Query-Kosten durch den Accuracy-Lift gerechtfertigt sind.
Wo geht semantische Suche schief?
Bei exakten Identifiern (SKUs, Kontonummern), bei seltenen Named-Entities, die das Embedding-Modell nicht gesehen hat, und bei Anfragen mit harten Constraints, die das System als weiche Präferenzen behandelt. Hybrides Retrieval, strukturierte Metadaten und explizite Filter adressieren die meisten davon.

Englische Fassung: Semantische Suche on the EN edition.