Osadzenie wektorowe

Numeryczna reprezentacja tekstu w wielowymiarowej przestrzeni wektorowej — gdzie podobne znaczeniowo teksty mają bliskie wektory — fundament wyszukiwania semantycznego i RAG. Pozwala AI porównywać znaczenie tekstów które nie mają wspólnych słów.

W Polsce nazywane też:

osadzenie wektorowereprezentacja wektorowawektor semantycznyembedding tekstu

Komputery rozumieją liczby, nie słowa. Żeby model AI mógł porównywać znaczenie dwóch tekstów, te teksty muszą być zamienione na liczby w taki sposób, że podobne znaczeniowo teksty dają podobne liczby — a teksty o różnym znaczeniu dają liczby odległe od siebie.

To właśnie robi embedding.

Czym jest embedding

Embedding to numeryczna reprezentacja tekstu, obrazu lub innego obiektu w wielowymiarowej przestrzeni wektorowej — gdzie podobne znaczeniowo obiekty mają bliskie wektory, a różne mają dalekie — używana jako fundament wyszukiwania semantycznego, RAG i wielu innych zastosowań AI. Tekst „agent AI” i „autonomiczny system sztucznej inteligencji” będą miały bliskie embeddingi mimo że nie mają wspólnych słów.

Jak to działa

Model embeddingowy (np. text-embedding-3-small od OpenAI, lub modele open-source jak sentence-transformers) przetwarza tekst i zwraca wektor — listę liczb zmiennoprzecinkowych, zazwyczaj 768 do 3072 wymiarów. Ten wektor koduje „znaczenie” tekstu w sposób który model nauczył się podczas treningu.

Dwa teksty o podobnym znaczeniu będą miały wektory których odległość cosine (kąt między nimi) jest mała. „Jak działa MCP?” i „Co to jest Model Context Protocol?” — bardzo bliskie embeddingi. „Jak działa MCP?” i „Przepis na sernik” — bardzo odległe.

Embedding w RAG

RAG działa przez embeddingi. Wszystkie dokumenty w bazie wiedzy są najpierw zamieniane na embeddingi i przechowywane w vector database. Gdy użytkownik zadaje pytanie — pytanie też jest zamieniane na embedding i porównywane z embeddingami dokumentów. Dokumenty z najbliższymi embeddingami są pobierane jako kontekst dla modelu.

To jest kluczowa właściwość RAG: wyszukiwanie semantyczne przez embeddingi zamiast wyszukiwania słów kluczowych. Agent który szuka odpowiedzi na pytanie „jak agent może kupić produkt?” znajdzie dokumenty o Instant Checkout i agentic commerce — nawet jeśli nie zawierają tych konkretnych słów.

Embeddingi dla właściciela strony

Właściciel strony który buduje chatbota lub agenta opartego na własnej treści musi zbudować embeddingi swojej bazy wiedzy. Każdy artykuł, każda strona FAQ, każdy dokument produktowy — jest zamieniany na embedding i przechowywany w vector database.

Jakość embeddingów zależy od modelu embeddingowego i jakości tekstu. Chunking (sposób dzielenia tekstu na fragmenty przed embeddingiem) ma duży wpływ na jakość retrieval. Zbyt duże chunki gubią szczegóły, zbyt małe tracą kontekst.

Koszty

Generowanie embeddingów kosztuje — zarówno obliczeniowo jak i finansowo jeśli używasz API. OpenAI text-embedding-3-small: $0.02 za milion tokenów. Dla typowego serwisu contentowego z kilkuset artykułami koszt jednorazowego embeddingu to kilka złotych. Re-embedding przy każdej aktualizacji treści jest tańszy bo dotyczy tylko zmienionych dokumentów.

Powiązane pojęcia

Wektorowa baza danychBaza danych zoptymalizowana pod przechowywanie i przeszukiwanie embeddingów — umożliwiająca szybkie wyszukiwanie semantyczne "znajdź K najbliższych wektorów do tego zapytania". Fundament infrastruktury RAG dla agentów AI.Fragmentacja dokumentówProces dzielenia długich dokumentów na mniejsze fragmenty przed embeddingiem — kluczowy krok w pipeline RAG który bezpośrednio wpływa na jakość wyszukiwania semantycznego. Zbyt małe chunki tracą kontekst, zbyt duże gubią szczegóły. Właściwy chunking to jeden z najważniejszych czynników jakości RAG.NLWebStandard Microsoftu ogłoszony na Build 2025 przez R.V. Guha — pozwala każdej stronie wystawiać konwersacyjny interfejs dla agentów AI przez endpointy /ask i /mcp, używając Schema.org jako bazy wiedzy. Każda instancja NLWeb jest też serwerem MCP.Okno kontekstuMaksymalna ilość tekstu (mierzona w tokenach) którą model AI może przetworzyć w jednym zapytaniu — determinuje ile treści strony agent może przeczytać naraz i dlaczego Markdown for Agents ma znaczenie.RAGRetrieval-Augmented Generation — technika wzbogacania odpowiedzi modelu AI o dane pobrane w czasie rzeczywistym ze stron WWW lub baz wiedzy, zamiast polegania wyłącznie na wiedzy z treningu.