Eine Vektor-Datenbank speichert Text, Bilder oder andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz. Sie ist das Substrat unter Retrieval-Augmented Generation, semantischer Suche und Recommendation-Systemen — der Teil eines KI-Stacks, der dem Modell erlaubt, relevanten Kontext ohne Keyword-Matching zu finden.

Was eine Vektor-Datenbank speichert.

Jede Zeile ist ein Embedding (typischerweise ein 384-, 768- oder 1536-dimensionaler Float-Vektor) plus der Original-Text und eine Handvoll Metadaten-Felder. Anfragen werden ebenfalls embeddet, dann gibt die Datenbank die top-K Zeilen zurück, die per Cosinus-Ähnlichkeit oder Dot-Product im Vektor-Raum am nächsten sind.

Wann eine Vektor-Datenbank einsetzen.

  • Retrieval für RAG. Ein LLM in Ihren eigenen Dokumenten, Policies, Transkripten oder Produkt-Specs erden.
  • Semantische Suche. Such-Interfaces, wo Keyword-Match allein offensichtliche Antworten verfehlt («wie kündige ich» sollte «Kündigungs-Policy» matchen).
  • De-Duplizierung und Clustering. Near-Duplicate- Records finden, ähnliche Leads, ähnliche Tickets.
  • Recommendation. «Items ähnlich zu diesem» ohne eine explizite Taxonomie zu bauen.

Was eine Vektor-Datenbank nicht ist.

Sie ersetzt keine relationale Datenbank. Sie ist nicht der Ort, wo Sie Ihre Kundendaten, Transaktions-Historie oder Source-of-Truth ablegen. Vektor-Datenbanken leben neben Postgres, MySQL oder was das System-of-Record schon ist, und sie speichern aus diesen Daten abgeleitete Embeddings.

«Postgres ist die Source-of-Truth. Der Vektor-Store ist der Index für Similarity.»

Morvion-Defaults.

Für die meisten Engagements nutzt Morvion pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert komfortabel auf Millionen Embeddings. Dedizierte Vektor-Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle, nicht davor.

Häufige Fragen.

Was ist eine Vektor-Datenbank?
Eine Vektor-Datenbank speichert Text und andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz. Sie ist das Substrat unter RAG, semantischer Suche und Recommendation-Systemen.
Brauche ich eine Vektor-Datenbank, um KI zu nutzen?
Nein. Sie brauchen eine nur, wenn Ihr KI-Workflow aus einem grossen Korpus eigener Daten retrieven muss. Direkte Prompts an ein LLM, Function-Calling und gut gescopte agentische Workflows können alle ganz ohne Retrieval funktionieren.
Welche Vektor-Datenbank nutzt Morvion standardmässig?
pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert auf Millionen Embeddings. Dedizierte Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle.
Wie fügt sich eine Vektor-Datenbank in eine RAG-Pipeline ein?
Sie ist der Retrieval-Store. Dokumente werden gechunkt, embeddet und in die Vektor-Datenbank eingefügt. Zur Query-Zeit wird die Nutzerfrage embeddet und die top-K ähnlichsten Chunks werden retrievt und ans LLM als Kontext übergeben. Reranking, Metadaten-Filtering und hybride Suche mit einem Keyword-Index sitzen auf diesem Basis-Flow.

Englische Fassung: Vektor-Datenbank on the EN edition.