Osadzenie wektorowe

Numeryczna reprezentacja tekstu w wielowymiarowej przestrzeni wektorowej — gdzie podobne znaczeniowo teksty mają bliskie wektory — fundament wyszukiwania semantycznego i RAG. Pozwala AI porównywać znaczenie tekstów które nie mają wspólnych słów.

W Polsce nazywane też:

osadzenie wektorowereprezentacja wektorowawektor semantycznyembedding tekstu

Komputery rozumieją liczby, nie słowa. Żeby model AI mógł porównywać znaczenie dwóch tekstów, te teksty muszą być zamienione na liczby w taki sposób, że podobne znaczeniowo teksty dają podobne liczby — a teksty o różnym znaczeniu dają liczby odległe od siebie.

To właśnie robi embedding.

Czym jest embedding

Embedding to numeryczna reprezentacja tekstu, obrazu lub innego obiektu w wielowymiarowej przestrzeni wektorowej — gdzie podobne znaczeniowo obiekty mają bliskie wektory, a różne mają dalekie — używana jako fundament wyszukiwania semantycznego, RAG i wielu innych zastosowań AI. Tekst „agent AI” i „autonomiczny system sztucznej inteligencji” będą miały bliskie embeddingi mimo że nie mają wspólnych słów.

Jak to działa

Model embeddingowy (np. text-embedding-3-small od OpenAI, lub modele open-source jak sentence-transformers) przetwarza tekst i zwraca wektor — listę liczb zmiennoprzecinkowych, zazwyczaj 768 do 3072 wymiarów. Ten wektor koduje „znaczenie” tekstu w sposób który model nauczył się podczas treningu.

Dwa teksty o podobnym znaczeniu będą miały wektory których odległość cosine (kąt między nimi) jest mała. „Jak działa MCP?” i „Co to jest Model Context Protocol?” — bardzo bliskie embeddingi. „Jak działa MCP?” i „Przepis na sernik” — bardzo odległe.

Embedding w RAG

RAG działa przez embeddingi. Wszystkie dokumenty w bazie wiedzy są najpierw zamieniane na embeddingi i przechowywane w vector database. Gdy użytkownik zadaje pytanie — pytanie też jest zamieniane na embedding i porównywane z embeddingami dokumentów. Dokumenty z najbliższymi embeddingami są pobierane jako kontekst dla modelu.

To jest kluczowa właściwość RAG: wyszukiwanie semantyczne przez embeddingi zamiast wyszukiwania słów kluczowych. Agent który szuka odpowiedzi na pytanie „jak agent może kupić produkt?” znajdzie dokumenty o Instant Checkout i agentic commerce — nawet jeśli nie zawierają tych konkretnych słów.

Embeddingi dla właściciela strony

Właściciel strony który buduje chatbota lub agenta opartego na własnej treści musi zbudować embeddingi swojej bazy wiedzy. Każdy artykuł, każda strona FAQ, każdy dokument produktowy — jest zamieniany na embedding i przechowywany w vector database.

Jakość embeddingów zależy od modelu embeddingowego i jakości tekstu. Chunking (sposób dzielenia tekstu na fragmenty przed embeddingiem) ma duży wpływ na jakość retrieval. Zbyt duże chunki gubią szczegóły, zbyt małe tracą kontekst.

Koszty

Generowanie embeddingów kosztuje — zarówno obliczeniowo jak i finansowo jeśli używasz API. OpenAI text-embedding-3-small: $0.02 za milion tokenów. Dla typowego serwisu contentowego z kilkuset artykułami koszt jednorazowego embeddingu to kilka złotych. Re-embedding przy każdej aktualizacji treści jest tańszy bo dotyczy tylko zmienionych dokumentów.