Vektor-Suche ist die Retrieval-Methode, die Embedding-Vektoren vergleicht, um die Records zu finden, die einer Anfrage semantisch am nächsten sind. Cosinus-Ähnlichkeit oder Dot-Product ersetzt Keyword-Matching, sodass das System die Dokumente zurückgibt, die meinen, was die Anfrage meint, nicht die Dokumente, die ihre Wörter teilen.

Wie Vektor-Suche funktioniert.

Jeder Record wird zur Write-Zeit einmal embeddet, als Vektor in einem spezialisierten Index gespeichert. Zur Query-Zeit wird die Anfrage mit demselben Modell embeddet, dann gibt der Index die top-K nächsten Vektoren nach Similarity zurück. Der Index nutzt Approximate-Nearest-Neighbor-Algorithmen (HNSW ist 2026 am gängigsten), sodass die Suche in Millisekunden zurückkommt, selbst über Millionen Records.

Warum Vektor-Suche wichtig ist.

Keyword-Suche scheitert, wenn der Nutzer «Weinbar mit Separée» fragt und das Venue sich als «Wine bar with private room» beschreibt. Vektor-Suche gibt den Match zurück, weil die Bedeutungen im Embedding-Raum nah sind. Jedes moderne Semantic-Search-, Recommendation- und Retrieval-Augmented- System läuft auf diesem Primitiv.

Häufige Fallstricke.

  • Veralteter Index. Embeddings hängen von der Modellversion ab. Wird das Embedding-Modell aktualisiert, muss der Index neu gebaut werden; sonst leben alte und neue Vektoren in unterschiedlichen Räumen.
  • Top-K zu klein. Fünf Resultate zu retrieven, wenn der Workflow zwanzig braucht, hungert den Generator aus. Tunen Sie K gegen reale Workflow-Bedürfnisse, nicht gegen einen Default.
  • Kein Reranker. Vektor-Suche optimiert auf Similarity, nicht Relevanz. Ein günstiger sekundärer Reranker (ein kleineres LLM oder ein Cross-Encoder) verbessert Präzision oft substanziell.
  • Kein Metadaten-Filter. Pure Vektor-Suche ignoriert strukturierte Constraints. Die meisten produktiven Systeme kombinieren Vektor-Similarity mit Metadaten-Filtern (Datum, Sprache, Tenant) für akkurate Resultate.

Häufige Fragen.

Was ist Vektor-Suche?
Vektor-Suche ist die Retrieval-Methode, die Records findet, die einer Anfrage semantisch am ähnlichsten sind, indem sie ihre Embedding-Vektoren mit Cosinus-Ähnlichkeit oder Dot-Product vergleicht, statt Keywords zu matchen. Sie ist die Engine hinter moderner semantischer Suche, RAG und Recommendation-Systemen.
Ist Vektor-Suche dasselbe wie semantische Suche?
Vektor-Suche ist das zugrundeliegende Primitiv; semantische Suche ist die nutzer-zugewandte Fähigkeit, die darauf aufbaut. Semantische Suche involviert typischerweise auch Query-Rewriting, Reranking und Metadaten-Filter um den Vektor-Such-Schritt herum.
Was ist HNSW?
Hierarchical Navigable Small World ist der 2026 gängigste Approximate-Nearest-Neighbor-Algorithmus, der von Vektor-Datenbanken genutzt wird. Er gibt near-exact Resultate in Millisekunden über Millionen Vektoren zurück, indem er eine Hierarchie von Proximity-Graphen durchläuft.
Brauchen wir noch Keyword-Suche, wenn wir Vektor-Suche haben?
Oft ja. Produktives Retrieval läuft häufig mit beidem, fusioniert die Resultate und rerankt dann. Vektor-Suche glänzt bei Intent und Synonymie; Keyword-Suche glänzt bei exakten Identifiern, Codes, Namen und seltenen Begriffen. Hybrides Retrieval schlägt beide allein auf den meisten Workflows.

Englische Fassung: Vektor-Suche on the EN edition.