Brauche ich eine Vektor-Datenbank, um KI zu nutzen?

Nein. Sie brauchen eine nur, wenn Ihr KI-Workflow aus einem grossen Korpus eigener Daten retrieven muss. Direkte Prompts an ein LLM, Function-Calling und gut gescopte agentische Workflows können alle ganz ohne Retrieval funktionieren.

Welche Vektor-Datenbank nutzt Morvion standardmässig?

pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert auf Millionen Embeddings. Dedizierte Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle.

Wie fügt sich eine Vektor-Datenbank in eine RAG-Pipeline ein?

Sie ist der Retrieval-Store. Dokumente werden gechunkt, embeddet und in die Vektor-Datenbank eingefügt. Zur Query-Zeit wird die Nutzerfrage embeddet und die top-K ähnlichsten Chunks werden retrievt und ans LLM als Kontext übergeben. Reranking, Metadaten-Filtering und hybride Suche mit einem Keyword-Index sitzen auf diesem Basis-Flow.

Vektor-Datenbank · Morvion Glossar

Eine Vektor-Datenbank speichert Text, Bilder oder andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz. Sie ist das Substrat unter Retrieval-Augmented Generation, semantischer Suche und Recommendation-Systemen — der Teil eines KI-Stacks, der dem Modell erlaubt, relevanten Kontext ohne Keyword-Matching zu finden.

Was eine Vektor-Datenbank speichert.

Jede Zeile ist ein Embedding (typischerweise ein 384-, 768- oder 1536-dimensionaler Float-Vektor) plus der Original-Text und eine Handvoll Metadaten-Felder. Anfragen werden ebenfalls embeddet, dann gibt die Datenbank die top-K Zeilen zurück, die per Cosinus-Ähnlichkeit oder Dot-Product im Vektor-Raum am nächsten sind.

Wann eine Vektor-Datenbank einsetzen.

Retrieval für RAG. Ein LLM in Ihren eigenen Dokumenten, Policies, Transkripten oder Produkt-Specs erden.
Semantische Suche. Such-Interfaces, wo Keyword-Match allein offensichtliche Antworten verfehlt («wie kündige ich» sollte «Kündigungs-Policy» matchen).
De-Duplizierung und Clustering. Near-Duplicate- Records finden, ähnliche Leads, ähnliche Tickets.
Recommendation. «Items ähnlich zu diesem» ohne eine explizite Taxonomie zu bauen.

Was eine Vektor-Datenbank nicht ist.

Sie ersetzt keine relationale Datenbank. Sie ist nicht der Ort, wo Sie Ihre Kundendaten, Transaktions-Historie oder Source-of-Truth ablegen. Vektor-Datenbanken leben neben Postgres, MySQL oder was das System-of-Record schon ist, und sie speichern aus diesen Daten abgeleitete Embeddings.

«Postgres ist die Source-of-Truth. Der Vektor-Store ist der Index für Similarity.»

Morvion-Defaults.

Für die meisten Engagements nutzt Morvion pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert komfortabel auf Millionen Embeddings. Dedizierte Vektor-Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle, nicht davor.

Häufige Fragen.

Was ist eine Vektor-Datenbank?: Eine Vektor-Datenbank speichert Text und andere Daten als hochdimensionale Embeddings und retrievt die ähnlichsten Items per mathematischer Distanz. Sie ist das Substrat unter RAG, semantischer Suche und Recommendation-Systemen.
Brauche ich eine Vektor-Datenbank, um KI zu nutzen?: Nein. Sie brauchen eine nur, wenn Ihr KI-Workflow aus einem grossen Korpus eigener Daten retrieven muss. Direkte Prompts an ein LLM, Function-Calling und gut gescopte agentische Workflows können alle ganz ohne Retrieval funktionieren.
Welche Vektor-Datenbank nutzt Morvion standardmässig?: pgvector — die Postgres-Extension, die Vektor-Spalten und Similarity-Operatoren hinzufügt. Sie hält alles in einer Datenbank, vereinfacht Backup und Zugriffskontrolle und skaliert auf Millionen Embeddings. Dedizierte Services (Pinecone, Qdrant, Weaviate) verdienen ihre Komplexität bei der Zehn-Millionen-Vektoren-Schwelle.
Wie fügt sich eine Vektor-Datenbank in eine RAG-Pipeline ein?: Sie ist der Retrieval-Store. Dokumente werden gechunkt, embeddet und in die Vektor-Datenbank eingefügt. Zur Query-Zeit wird die Nutzerfrage embeddet und die top-K ähnlichsten Chunks werden retrievt und ans LLM als Kontext übergeben. Reranking, Metadaten-Filtering und hybride Suche mit einem Keyword-Index sitzen auf diesem Basis-Flow.

Englische Fassung: Vektor-Datenbank on the EN edition.

Vektor-Datenbank

Was eine Vektor-Datenbank speichert.

Wann eine Vektor-Datenbank einsetzen.

Was eine Vektor-Datenbank nicht ist.

Morvion-Defaults.

Häufige Fragen.

Retrieval-Augmented Generation (RAG)

Weiter im Glossar.

KI-Infrastruktur

Eval-Harness

Regression Gate

RAG (Retrieval-Augmented Generation)

Model Context Protocol (MCP)

Agent Tool Use

LLM-Guardrails

Vektor-Index

Strukturierte Ausgabe

Prompt Injection

Observability-Traces

Agent-Handoff

Retrieval-Rerank

KI-Observability

Multi-Agent-Workflow

Embedding-Modell

Semantische Suche

Fine-Tuning

Halluzination

Chain-of-Thought

Function Calling

Agentic Search

Embedding-Raum

Context-Window

Prompt Engineering

Vektor-Suche

Token-Budget

Semantischer Cache

Faithfulness

Cross-Encoder

Modell-Router

KI-Kostenkontrolle

Modell-Destillation

Safety-Rails

KI-Agent

CRM-Intelligenz

Document Intelligence

Eval-Driven KI

Discovery Sprint

Digital Operating Layer

Immersive Website

Hospitality-Website

Marktplatz-Plattform

Business Intelligence Dashboard

Echtzeit-Dashboard

Kunden-Portal

Agent-Memory

Strukturierte Extraktion

KI-Evaluations-Framework

Retrieval-Qualität

KI-Guardrail-Policy

Eval-Fixture

Eval-Rubrik

KI-Incident

Agent-Orchestrierung

Eval-Versionierung

Modell-Fallback

Fein-granulares Routing

KI-Policy-Versionskontrolle