Was ist ein Vektor-Index?

Ein Vektor-Index ist die Datenstruktur, die Embedding-Vektoren mit Approximate-Nearest-Neighbour-Lookups speichert und die top-K ähnlichsten Items in Millisekunden über Millionen von Datensätzen liefert. Es ist die produktive Infrastruktur, die semantische Suche und RAG schnell macht.

Brauche ich eine dedizierte Vektor-Datenbank?

Wahrscheinlich nicht am Anfang. Postgres + pgvector ist der richtige Default für die meisten Teams: Der Vektor-Index lebt neben den Applikationsdaten, Transaktionen sind atomisch, operative Komplexität minimal. Dedizierte Stores (Pinecone, Weaviate, Qdrant) verdienen ihre Kosten über ein paar Millionen Vektoren oder wenn Retrieval der Engpass ist.

Was ist der Unterschied zwischen einem Vektor-Index und einem Vektor-Store?

Ein Vektor-Index ist die Datenstruktur (HNSW, IVF, Flat). Ein Vektor-Store ist der Managed Service oder die Datenbank, die ihn hostet. Postgres + pgvector ist ein Vektor-Store mit einem HNSW-Vektor-Index. Pinecone ist ein Vektor-Store, der seine Index-Implementierung hinter einer API versteckt.

Soll ich den Vektor-Index auf höheren Recall oder niedrigere Latenz tunen?

Messen Sie beides gegen Ihre tatsächliche Query-Verteilung. HNSW exponiert zwei Regler: efConstruction (Build-Zeit-Recall) und efSearch (Query-Zeit-Recall). Niedrigeres efSearch ist schneller, verfehlt aber mehr relevante Chunks; höheres efSearch ist langsamer, fängt aber mehr. Die Eval-Harness wählt den richtigen Punkt.

Vektor-Index · Morvion Glossar

Ein Vektor-Index ist die Datenstruktur, die semantische Suche in Produktion schnell macht. Rohe Embedding-Vektoren zu speichern und sie einzeln gegen einen Query-Embedding zu vergleichen funktioniert bei kleinen Datenmengen, kollabiert aber jenseits weniger tausend Datensätze. Ein Vektor-Index nutzt Approximate- Nearest-Neighbour-Algorithmen, um die top-K ähnlichsten Items in einstelligen Millisekunden über Millionen von Datensätzen zurückzugeben.

Die gängigen Algorithmen.

HNSW (Hierarchical Navigable Small World). Der Produktions-Default. Exzellente Recall, schnelle Queries, moderater Speicher-Footprint. Genutzt von FAISS, Pinecone, Weaviate, pgvector, Qdrant.
IVF (Inverted File). Clustert Embeddings in Zellen; Queries scannen nur naheliegende Zellen. Schnellerer Build, niedrigerer Recall.
Flat / Brute Force. Jeden Vektor scannen. Höchster Recall, niedrigste Latenz bei kleiner Datenmenge (unter ~50k Vektoren), kein Index-Build-Schritt.

Wo hosten.

Postgres + pgvector ist der richtige Default für die meisten Teams: Der Vektor-Index lebt in derselben Datenbank wie die übrigen Applikationsdaten, Transaktionen sind atomisch, die operative Komplexität ist minimal. Dedizierte Vektor-Stores (Pinecone, Weaviate, Qdrant) verdienen ihre Kosten über ein paar Millionen Vektoren oder wenn Retrieval der Engpass ist und das Team spezialisiertes Index-Tuning braucht.

Hybrides Retrieval.

Ein Vektor-Index allein verfehlt Exact-Match-Queries — Namen, Codes und seltene Begriffe bekommen schlechten Recall in reiner semantischer Suche. Die produktive Antwort ist hybrides Retrieval: Vektor-Index-Ergebnisse mit BM25-Keyword-Scores via Reciprocal Rank Fusion kombinieren. Die Eval-Harness misst, welche Mischung für die spezifische Query-Verteilung gewinnt, und das Team tunt entsprechend.

Häufige Fragen.

Was ist ein Vektor-Index?: Ein Vektor-Index ist die Datenstruktur, die Embedding-Vektoren mit Approximate-Nearest-Neighbour-Lookups speichert und die top-K ähnlichsten Items in Millisekunden über Millionen von Datensätzen liefert. Es ist die produktive Infrastruktur, die semantische Suche und RAG schnell macht.
Brauche ich eine dedizierte Vektor-Datenbank?: Wahrscheinlich nicht am Anfang. Postgres + pgvector ist der richtige Default für die meisten Teams: Der Vektor-Index lebt neben den Applikationsdaten, Transaktionen sind atomisch, operative Komplexität minimal. Dedizierte Stores (Pinecone, Weaviate, Qdrant) verdienen ihre Kosten über ein paar Millionen Vektoren oder wenn Retrieval der Engpass ist.
Was ist der Unterschied zwischen einem Vektor-Index und einem Vektor-Store?: Ein Vektor-Index ist die Datenstruktur (HNSW, IVF, Flat). Ein Vektor-Store ist der Managed Service oder die Datenbank, die ihn hostet. Postgres + pgvector ist ein Vektor-Store mit einem HNSW-Vektor-Index. Pinecone ist ein Vektor-Store, der seine Index-Implementierung hinter einer API versteckt.
Soll ich den Vektor-Index auf höheren Recall oder niedrigere Latenz tunen?: Messen Sie beides gegen Ihre tatsächliche Query-Verteilung. HNSW exponiert zwei Regler: efConstruction (Build-Zeit-Recall) und efSearch (Query-Zeit-Recall). Niedrigeres efSearch ist schneller, verfehlt aber mehr relevante Chunks; höheres efSearch ist langsamer, fängt aber mehr. Die Eval-Harness wählt den richtigen Punkt.

Englische Fassung: Vektor-Index on the EN edition.

Vektor-Index

Die gängigen Algorithmen.

Wo hosten.

Hybrides Retrieval.

Häufige Fragen.

Intelligente Systeme & KI-Infrastruktur

Weiter im Glossar.

KI-Infrastruktur

Eval-Harness

Regression Gate

RAG (Retrieval-Augmented Generation)

Model Context Protocol (MCP)

Agent Tool Use

LLM-Guardrails

Strukturierte Ausgabe

Prompt Injection

Observability-Traces

Agent-Handoff

Retrieval-Rerank

KI-Observability

Multi-Agent-Workflow

Embedding-Modell

Semantische Suche

Vektor-Datenbank

Fine-Tuning

Halluzination

Chain-of-Thought

Function Calling

Agentic Search

Embedding-Raum

Context-Window

Prompt Engineering

Vektor-Suche

Token-Budget

Semantischer Cache

Faithfulness

Cross-Encoder

Modell-Router

KI-Kostenkontrolle

Modell-Destillation

Safety-Rails

KI-Agent

CRM-Intelligenz

Document Intelligence

Eval-Driven KI

Discovery Sprint

Digital Operating Layer

Immersive Website

Hospitality-Website

Marktplatz-Plattform

Business Intelligence Dashboard

Echtzeit-Dashboard

Kunden-Portal

Agent-Memory

Strukturierte Extraktion

KI-Evaluations-Framework

Retrieval-Qualität

KI-Guardrail-Policy

Eval-Fixture

Eval-Rubrik

KI-Incident

Agent-Orchestrierung

Eval-Versionierung

Modell-Fallback

Fein-granulares Routing

KI-Policy-Versionskontrolle