Komputery rozumieją liczby, nie słowa. Żeby model AI mógł porównywać znaczenie dwóch tekstów, te teksty muszą być zamienione na liczby w taki sposób, że podobne znaczeniowo teksty dają podobne liczby — a teksty o różnym znaczeniu dają liczby odległe od siebie.
To właśnie robi embedding.
Czym jest embedding
Embedding to numeryczna reprezentacja tekstu, obrazu lub innego obiektu w wielowymiarowej przestrzeni wektorowej — gdzie podobne znaczeniowo obiekty mają bliskie wektory, a różne mają dalekie — używana jako fundament wyszukiwania semantycznego, RAG i wielu innych zastosowań AI. Tekst „agent AI” i „autonomiczny system sztucznej inteligencji” będą miały bliskie embeddingi mimo że nie mają wspólnych słów.
Jak to działa
Model embeddingowy (np. text-embedding-3-small od OpenAI, lub modele open-source jak sentence-transformers) przetwarza tekst i zwraca wektor — listę liczb zmiennoprzecinkowych, zazwyczaj 768 do 3072 wymiarów. Ten wektor koduje „znaczenie” tekstu w sposób który model nauczył się podczas treningu.
Dwa teksty o podobnym znaczeniu będą miały wektory których odległość cosine (kąt między nimi) jest mała. „Jak działa MCP?” i „Co to jest Model Context Protocol?” — bardzo bliskie embeddingi. „Jak działa MCP?” i „Przepis na sernik” — bardzo odległe.
Embedding w RAG
RAG działa przez embeddingi. Wszystkie dokumenty w bazie wiedzy są najpierw zamieniane na embeddingi i przechowywane w vector database. Gdy użytkownik zadaje pytanie — pytanie też jest zamieniane na embedding i porównywane z embeddingami dokumentów. Dokumenty z najbliższymi embeddingami są pobierane jako kontekst dla modelu.
To jest kluczowa właściwość RAG: wyszukiwanie semantyczne przez embeddingi zamiast wyszukiwania słów kluczowych. Agent który szuka odpowiedzi na pytanie „jak agent może kupić produkt?” znajdzie dokumenty o Instant Checkout i agentic commerce — nawet jeśli nie zawierają tych konkretnych słów.
Embeddingi dla właściciela strony
Właściciel strony który buduje chatbota lub agenta opartego na własnej treści musi zbudować embeddingi swojej bazy wiedzy. Każdy artykuł, każda strona FAQ, każdy dokument produktowy — jest zamieniany na embedding i przechowywany w vector database.
Jakość embeddingów zależy od modelu embeddingowego i jakości tekstu. Chunking (sposób dzielenia tekstu na fragmenty przed embeddingiem) ma duży wpływ na jakość retrieval. Zbyt duże chunki gubią szczegóły, zbyt małe tracą kontekst.
Koszty
Generowanie embeddingów kosztuje — zarówno obliczeniowo jak i finansowo jeśli używasz API. OpenAI text-embedding-3-small: $0.02 za milion tokenów. Dla typowego serwisu contentowego z kilkuset artykułami koszt jednorazowego embeddingu to kilka złotych. Re-embedding przy każdej aktualizacji treści jest tańszy bo dotyczy tylko zmienionych dokumentów.