Eine Vektor-Datenbank speichert Text, Bilder oder andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz. Sie ist das Substrat unter Retrieval-Augmented Generation, semantischer Suche und Recommendation-Systemen — der Teil eines KI-Stacks, der dem Modell erlaubt, relevanten Kontext ohne Keyword-Matching zu finden.
Was eine Vektor-Datenbank speichert.
Jede Zeile ist ein Embedding (typischerweise ein 384-, 768- oder 1536-dimensionaler Float-Vektor) plus der Original-Text und eine Handvoll Metadaten-Felder. Anfragen werden ebenfalls embeddet, dann gibt die Datenbank die top-K Zeilen zurück, die per Cosinus-Ähnlichkeit oder Dot-Product im Vektor-Raum am nächsten sind.
Wann eine Vektor-Datenbank einsetzen.
- Retrieval für RAG. Ein LLM in Ihren eigenen Dokumenten, Policies, Transkripten oder Produkt-Specs erden.
- Semantische Suche. Such-Interfaces, wo Keyword-Match allein offensichtliche Antworten verfehlt («wie kündige ich» sollte «Kündigungs-Policy» matchen).
- De-Duplizierung und Clustering. Near-Duplicate- Records finden, ähnliche Leads, ähnliche Tickets.
- Recommendation. «Items ähnlich zu diesem» ohne eine explizite Taxonomie zu bauen.
Was eine Vektor-Datenbank nicht ist.
Sie ersetzt keine relationale Datenbank. Sie ist nicht der Ort, wo Sie Ihre Kundendaten, Transaktions-Historie oder Source-of-Truth ablegen. Vektor-Datenbanken leben neben Postgres, MySQL oder was das System-of-Record schon ist, und sie speichern aus diesen Daten abgeleitete Embeddings.
«Postgres ist die Source-of-Truth. Der Vektor-Store ist der Index für Similarity.»
Morvion-Defaults.
Für die meisten Engagements nutzt Morvion pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert komfortabel auf Millionen Embeddings. Dedizierte Vektor-Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle, nicht davor.
Häufige Fragen.
- Was ist eine Vektor-Datenbank?
- Eine Vektor-Datenbank speichert Text und andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz. Sie ist das Substrat unter RAG, semantischer Suche und Recommendation-Systemen.
- Brauche ich eine Vektor-Datenbank, um KI zu nutzen?
- Nein. Sie brauchen eine nur, wenn Ihr KI-Workflow aus einem grossen Korpus eigener Daten retrieven muss. Direkte Prompts an ein LLM, Function-Calling und gut gescopte agentische Workflows können alle ganz ohne Retrieval funktionieren.
- Welche Vektor-Datenbank nutzt Morvion standardmässig?
- pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert auf Millionen Embeddings. Dedizierte Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle.
- Wie fügt sich eine Vektor-Datenbank in eine RAG-Pipeline ein?
- Sie ist der Retrieval-Store. Dokumente werden gechunkt, embeddet und in die Vektor-Datenbank eingefügt. Zur Query-Zeit wird die Nutzerfrage embeddet und die top-K ähnlichsten Chunks werden retrievt und ans LLM als Kontext übergeben. Reranking, Metadaten-Filtering und hybride Suche mit einem Keyword-Index sitzen auf diesem Basis-Flow.
Englische Fassung: Vektor-Datenbank on the EN edition.