Tradycyjna baza danych jest dobra w jednym: znajdź rekord gdzie pole X ma wartość Y. SELECT * FROM articles WHERE id = 42. Precyzyjne, deterministyczne, szybkie.
Ale co gdy pytanie brzmi „znajdź artykuły które są znaczeniowo podobne do tego zapytania”? Tradycyjna baza danych tego nie umie — bo nie rozumie „znaczeniowo podobne”. Może szukać słów kluczowych, ale nie semantyki.
Vector database rozwiązuje dokładnie ten problem.
Czym jest vector database
Vector database to baza danych zoptymalizowana pod przechowywanie i przeszukiwanie embeddingów — wektorowych reprezentacji tekstów, obrazów lub innych danych — umożliwiająca szybkie wyszukiwanie semantyczne: „znajdź K najbliższych wektorów do tego zapytania”. Fundament infrastruktury RAG dla agentów AI.
Jak to działa
Zamiast indeksować wartości pól, vector database indeksuje wielowymiarowe wektory (embeddingi). Gdy przychodzi zapytanie, jest zamieniane na embedding i vector database szuka wektorów o najmniejszej odległości cosine lub euclidean od wektora zapytania. Algorytmy przybliżonego wyszukiwania sąsiadów (ANN — Approximate Nearest Neighbors) jak HNSW pozwalają robić to szybko nawet na milionach wektorów.
Popularne vector databases
Pinecone — managed service, prosta integracja, dobra skalowalność. Weaviate — open-source, bogaty w funkcje, obsługuje multi-modal. Chroma — lekka, idealna dla prototypów i małych projektów, open-source. Qdrant — open-source, wysoka wydajność, Rust. pgvector — rozszerzenie dla PostgreSQL, nie wymaga osobnej bazy jeśli już masz PostgreSQL.
Dla większości właścicieli stron i małych projektów: Chroma lub pgvector wystarczą. Pinecone ma sens przy skali i gdy chcesz managed service bez zarządzania infrastrukturą.
Vector database a agent-readiness
Strona która buduje agenta opartego na własnej treści potrzebuje vector database jako fundamentu RAG. Artykuły ze słownika Webflux, dokumentacja produktu, FAQ — wszystko to trafia do vector database jako embeddingi, i agent może semantycznie przeszukiwać tę wiedzę.
Dla właściciela strony który korzysta z gotowych platform (Webflow, Framer, Shopify) — vector database jest zarządzany przez platformę lub narzędzie RAG. Własna implementacja jest potrzebna przy custom rozwiązaniach lub gdy chcesz pełną kontrolę nad danymi.
Koszt i skalowalność
Vector database dla kilku tysięcy dokumentów mieści się w pamięci lokalnej i jest bezpłatna (Chroma). Dla milionów dokumentów — Pinecone Starter to $0, plany płatne od $70/miesiąc. pgvector na typowym VPS z 2GB RAM obsłuży setki tysięcy wektorów bez problemu.