Wektorowa baza danych

Baza danych zoptymalizowana pod przechowywanie i przeszukiwanie embeddingów — umożliwiająca szybkie wyszukiwanie semantyczne "znajdź K najbliższych wektorów do tego zapytania". Fundament infrastruktury RAG dla agentów AI.

W Polsce nazywane też:

wektorowa baza danychbaza embeddingówbaza semantycznavector store

Tradycyjna baza danych jest dobra w jednym: znajdź rekord gdzie pole X ma wartość Y. SELECT * FROM articles WHERE id = 42. Precyzyjne, deterministyczne, szybkie.

Ale co gdy pytanie brzmi „znajdź artykuły które są znaczeniowo podobne do tego zapytania”? Tradycyjna baza danych tego nie umie — bo nie rozumie „znaczeniowo podobne”. Może szukać słów kluczowych, ale nie semantyki.

Vector database rozwiązuje dokładnie ten problem.

Czym jest vector database

Vector database to baza danych zoptymalizowana pod przechowywanie i przeszukiwanie embeddingów — wektorowych reprezentacji tekstów, obrazów lub innych danych — umożliwiająca szybkie wyszukiwanie semantyczne: „znajdź K najbliższych wektorów do tego zapytania”. Fundament infrastruktury RAG dla agentów AI.

Jak to działa

Zamiast indeksować wartości pól, vector database indeksuje wielowymiarowe wektory (embeddingi). Gdy przychodzi zapytanie, jest zamieniane na embedding i vector database szuka wektorów o najmniejszej odległości cosine lub euclidean od wektora zapytania. Algorytmy przybliżonego wyszukiwania sąsiadów (ANN — Approximate Nearest Neighbors) jak HNSW pozwalają robić to szybko nawet na milionach wektorów.

Popularne vector databases

Pinecone — managed service, prosta integracja, dobra skalowalność. Weaviate — open-source, bogaty w funkcje, obsługuje multi-modal. Chroma — lekka, idealna dla prototypów i małych projektów, open-source. Qdrant — open-source, wysoka wydajność, Rust. pgvector — rozszerzenie dla PostgreSQL, nie wymaga osobnej bazy jeśli już masz PostgreSQL.

Dla większości właścicieli stron i małych projektów: Chroma lub pgvector wystarczą. Pinecone ma sens przy skali i gdy chcesz managed service bez zarządzania infrastrukturą.

Vector database a agent-readiness

Strona która buduje agenta opartego na własnej treści potrzebuje vector database jako fundamentu RAG. Artykuły ze słownika Webflux, dokumentacja produktu, FAQ — wszystko to trafia do vector database jako embeddingi, i agent może semantycznie przeszukiwać tę wiedzę.

Dla właściciela strony który korzysta z gotowych platform (Webflow, Framer, Shopify) — vector database jest zarządzany przez platformę lub narzędzie RAG. Własna implementacja jest potrzebna przy custom rozwiązaniach lub gdy chcesz pełną kontrolę nad danymi.

Koszt i skalowalność

Vector database dla kilku tysięcy dokumentów mieści się w pamięci lokalnej i jest bezpłatna (Chroma). Dla milionów dokumentów — Pinecone Starter to $0, plany płatne od $70/miesiąc. pgvector na typowym VPS z 2GB RAM obsłuży setki tysięcy wektorów bez problemu.

Powiązane pojęcia

Fragmentacja dokumentówProces dzielenia długich dokumentów na mniejsze fragmenty przed embeddingiem — kluczowy krok w pipeline RAG który bezpośrednio wpływa na jakość wyszukiwania semantycznego. Zbyt małe chunki tracą kontekst, zbyt duże gubią szczegóły. Właściwy chunking to jeden z najważniejszych czynników jakości RAG.Osadzenie wektoroweNumeryczna reprezentacja tekstu w wielowymiarowej przestrzeni wektorowej — gdzie podobne znaczeniowo teksty mają bliskie wektory — fundament wyszukiwania semantycznego i RAG. Pozwala AI porównywać znaczenie tekstów które nie mają wspólnych słów.Pamięć agentaMechanizmy przechowywania i odzyskiwania informacji przez agenta AI poza granicami pojedynczej sesji — umożliwiające ciągłość kontekstu i personalizację — przez kombinację pamięci krótkoterminowej (okno kontekstu) i długoterminowej (zewnętrzne bazy wektorowe). Fundament agentów które poprawiają się w czasie.RAGRetrieval-Augmented Generation — technika wzbogacania odpowiedzi modelu AI o dane pobrane w czasie rzeczywistym ze stron WWW lub baz wiedzy, zamiast polegania wyłącznie na wiedzy z treningu.