Retrieval jako składanie kontekstu — just-in-time kontra wszystko na raz

Możesz dać agentowi całą wiedzę z góry.

Albo dać mu ją dokładnie wtedy, kiedy jej potrzebuje.

W poprzednim wpisie jedna z pięciu warstw okna dostała werdykt „prawie zawsze pobierać na żądanie, nie trzymać". To warstwa retrievalu — wiedzy, której agent nie ma w sobie ani w pamięci: dokumentacji, bazy wiedzy, danych produktowych, polityk. Ten wpis jest o tym werdykcie: dlaczego pobieranie na żądanie prawie zawsze wygrywa z ładowaniem wszystkiego z góry, i kiedy to „prawie" ma znaczenie.

Mechanikę samego pobierania — czym jest RAG, dlaczego powstało i kiedy ma sens — rozkłada artykuł serii o RAG. Tu patrzymy na retrieval z jednej, konkretnej strony: co i kiedy ląduje w oknie kontekstu.

Dwa podejścia do tej samej wiedzy

Masz bazę wiedzy — powiedzmy sto stron dokumentacji produktu. Agent ma odpowiadać na jej podstawie. Są dwa sposoby, żeby ta wiedza trafiła do modelu.

Preload — wszystko z góry. Wrzucasz całą dokumentację do okna na starcie i zostawiasz ją tam. Agent „ma wszystko". Proste do zbudowania, kuszące w swojej oczywistości.

Just-in-time — na żądanie. Trzymasz dokumentację poza oknem. Gdy konkretny krok wymaga konkretnej wiedzy, agent pobiera tylko ten fragment, który jest istotny, i tylko na ten krok. Okno zostaje chude.

Na pierwszy rzut oka preload wygląda bezpieczniej — „przecież lepiej, żeby miał komplet". Praktyka mówi odwrotnie. I to z powodów, które znasz już z dwóch poprzednich wpisów.

Dlaczego preload przegrywa

Trzy ceny ładowania wszystkiego z góry — i wszystkie trzy widzieliśmy już wcześniej, tylko z innej strony.

Zabija budżet okna. Sto stron dokumentacji w oknie to dziesiątki tysięcy tokenów, które siedzą tam przy każdym obrocie pętli — niezależnie od tego, czy bieżący krok ich potrzebuje. To dokładnie okno traktowane jak worek, tylko na sterydach.

Wywołuje context rot. Im więcej nieistotnej dokumentacji w oknie, tym trudniej modelowi znaleźć ten jeden akapit, który dotyczy bieżącego pytania. Sygnał tonie w komplecie. Agent „ma wszystko" i właśnie dlatego trafia gorzej.

Starzeje się. Wiedza wrzucona na starcie jest zamrożona w stanie z momentu startu. Jeśli w trakcie długiego zadania coś się zmieni — stan zamówienia, dostępność, cena — preload tego nie wie. Pobieranie na żądanie sięga po aktualny stan w momencie, w którym jest potrzebny.

Pętla agenta sprawia, że just-in-time jest wręcz naturalne. Agent i tak przy każdym kroku decyduje, co zrobić dalej — więc „pobierz to, czego ten krok wymaga" to po prostu jedna z jego akcji, a nie osobna mechanika doklejona z boku.

Retrieval jest tak dobry, jak to, co zwróci

Jest jedno „ale", którego nie wolno przemilczeć. Preload jest głupi, ale przewidywalny — agent dostaje całość, więc istotny fragment na pewno tam jest, choćby utopiony. Just-in-time jest mądrzejszy, ale zależy od trafności pobierania.Jeśli zapytanie do bazy wiedzy zwróci nie ten fragment, agent dostanie do okna kontekst, który wygląda sensownie, a prowadzi go na manowce.

To przesuwa ciężar: jakość kontekstu staje się jakością retrievalu. Garbage in, garbage context. Dlatego przy podejściu just-in-time inwestycja idzie w to, jak agent pyta i jak baza odpowiada — żeby zwracała trafnie, zwięźle i to, co istotne. To znów odsyła do mechaniki RAG: dobór tego, co wraca, jest osobnym rzemiosłem.

Praktyczna konsekwencja: pobieraj fragmenty, nie całe dokumenty. Zwrócenie całej strony dokumentacji „bo gdzieś tam jest odpowiedź" to preload tylnymi drzwiami — przenosisz problem zapchanego okna z etapu startu na etap pobierania. Dobry retrieval oddaje akapit, nie rozdział.

Podejście hybrydowe — bo „prawie zawsze" to nie „zawsze"

Werdykt z C2 brzmiał „prawie zawsze pobierać". To „prawie" ma sens. Nie wszystko opłaca się pobierać za każdym razem.

Sensowny układ dla większości agentów jest hybrydowy: mały, stabilny rdzeń w oknie na stałe + reszta just-in-time.Do rdzenia trafia to, czego agent potrzebuje praktycznie zawsze i co się nie zmienia — kluczowe reguły, podstawowy kontekst zadania. Wszystko, co jest potrzebne czasem albo co się zmienia, zostaje poza oknem i jest pobierane na żądanie.

Pytanie, które rozstrzyga, co idzie do rdzenia, to dokładnie heurystyka z C2: czy model potrzebuje tego przy każdym kroku? Jeśli tak — rdzeń. Jeśli „czasem" — retrieval. Hybryda to nie kompromis z lenistwa, tylko świadome rozłożenie: stałe na stałe, zmienne na żądanie.

Jak to wygląda w n8n

W n8n różnica jest namacalna. Wersja preload: węzeł, który na starcie wczytuje cały dokument / cały arkusz / całą tabelę i podpina to pod wejście modelu przy każdym kroku przepływu. Działa na małych danych, puchnie i gnije na większych.

Wersja just-in-time: model (albo logika przepływu) najpierw ustala, czego potrzebuje, a potem osobny węzeł pobiera tylko to — konkretny rekord, konkretny fragment, wynik konkretnego zapytania — i dopiero ten wynik wraca do okna. Więcej węzłów, więcej myślenia o tym, „kto pyta o co i kiedy" — ale chude okno, świeże dane i niższy rachunek przy każdym obrocie.

Moment, w którym przestajesz wczytywać wszystko pod wejście „bo może się przyda", a zaczynasz projektować kiedy i co przepływ pobiera — to jest moment, w którym retrieval przestaje być wczytywaniem pliku, a staje się składaniem kontekstu.

Co z tego wynika

Retrieval to nie „danie agentowi dostępu do wiedzy". To decyzja, która wiedza trafia do okna i w którym momencie.Preload odpowiada na to pytanie raz, na starcie, dla wszystkiego naraz — i płaci budżetem, trafnością i świeżością. Just-in-time odpowiada na nie krok po kroku, dla tego, co akurat potrzebne — i wygrywa wszędzie tam, gdzie wiedzy jest dużo albo gdzie się zmienia.

Zasada do zabrania: nie ładuj wiedzy do agenta — daj mu sposób, żeby sięgał po nią wtedy, gdy jej potrzebuje. A skoro już przy tym jesteśmy: część kontekstu, której nie da się po prostu „pobrać na nowo", bo to historia własnych kroków agenta — wymaga osobnego podejścia. O tym, jak nie gubić wątku, gdy ta historia rośnie, jest następny wpis tej kategorii: kompakcja kontekstu.

Pojęcia ze słownika: Just-in-time retrieval · Grounding · Okno kontekstu · Context rot · Budżet tokenów

Sprawdź słownik pojęć Agentic-Web

Przejdź do Strefy Divi

Spis treści

Atlas znika po dziewięciu miesiącach — a jego najważniejsza lekcja jest o bezpieczeństwie, nie o rynku

przez Łukasz | lip 13, 2026 | Agentic Web

OpenAI wygasza ChatGPT Atlas 9 sierpnia 2026. To dobry moment, żeby zapytać, dlaczego agentowa przeglądarka okazała się trudniejsza, niż wyglądała — i dlaczego problem nie zniknie razem z produktem. 9 lipca 2026 OpenAI ogłosił, że ChatGPT Atlas — dedykowana...

Poza AI Act — czego ta mapa nie obejmuje (a co też jest prawem)

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna — a ta konkretna strona jest mapą granic mapy: pokazuje terytoria, których hub świadomie nie opisuje, żeby nikt nie pomylił jego zasięgu z zasięgiem prawa. Data ostatniej weryfikacji treści: lipiec 2026. AI Act jest regulacją nową...

AI Act nie dzieli świata na Big Tech i resztę — dzieli na role: dostawca i podmiot stosujący. Firma używająca kupionego narzędzia AI ma własną rolę i własne obowiązki. Mapa tej roli

Firma jako podmiot stosujący — AI Act obowiązuje także tych, którzy niczego nie zbudowali

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję ról z tekstu rozporządzenia. Jaką rolę pełni Twoja firma wobec konkretnego systemu i jakie obowiązki z niej wynikają — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. AI Act przypisuje...

Oznaczanie treści generowanych przez AI — kto, co i od kiedy

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję obowiązków z art. 50 AI Act według tekstu przepisów i publicznie dostępnych projektów wytycznych. Czy i jak dotyczą Twoich treści — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. AI Act...

Piramida ryzyka — jak AI Act klasyfikuje systemy i gdzie na niej ląduje typowa firma

przez Łukasz | lip 12, 2026 | Agentic Web, Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję klasyfikacji z tekstu rozporządzenia. Do którego poziomu należy konkretny system w konkretnym użyciu — rozstrzyga analiza prawna, nie mapa. Data ostatniej weryfikacji treści: lipiec 2026. AI Act nie reguluje...

Chatbot i agent na stronie a obowiązek przejrzystości — termin, który nie został przesunięty

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy, co wynika z tekstu art. 50 AI Act i publicznie dostępnych wytycznych. Czy i jak przepis stosuje się do Twojego konkretnego wdrożenia — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. Od 2 sierpnia...

Kalendarz AI Act po Digital Omnibus — co obowiązuje, co wchodzi, co przesunięto

przez Łukasz | lip 11, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy terminy i kategorie wynikające z tekstu przepisów. Czy i jak dotyczą Twojego przypadku — rozstrzyga prawnik znający Twoją sytuację. Data ostatniej weryfikacji treści: lipiec 2026; przepisy w tym obszarze zmieniały się w...

Human-in-the-loop, który kłamie — jak zaprojektować okno zgody, które naprawdę chroni

przez Łukasz | lip 11, 2026 | Anatomia agenta AI

Dodałeś potwierdzenie przez człowieka. To nie znaczy, że dodałeś zabezpieczenie. Kiedy budujesz agenta, który robi coś nieodwracalnego — pisze pliki, wykonuje polecenia, wysyła pieniądze — prędzej czy później dokładasz punkt kontrolny: zanim agent to zrobi, pyta...

AI Website Tycoon

przez Łukasz | lip 9, 2026 | Gry

👑 AI WEBSITE TYCOON Symulator agencji stron przyszłości Rok 2025 Budżet 100 000 zł ⛶ 1 · Klient 2 · Budżet 3 · Wydarzenia 4 · Wyniki 5 · Raport AI Zbuduj stronę, którą poleci AI — nie tylko taką, która ładnie wygląda. Dostajesz klienta i 100 000 zł. Twoje...

Ekonomia widoczności — kto płaci za internet, który czytają maszyny

przez Łukasz | lip 9, 2026 | AI Visibility

Otwarty internet stał przez dwie dekady na niepisanej umowie: twórca oddaje treść do indeksowania, wyszukiwarka odsyła w zamian ruch, ruch monetyzuje się reklamą, sprzedażą albo marką. Systemy AI tę umowę łamią w połowie — czytają treść jak nikt wcześniej, ale...

« Starsze Wpisy

Retrieval jako składanie kontekstu — just-in-time kontra wszystko na raz

Możesz dać agentowi całą wiedzę z góry.

Albo dać mu ją dokładnie wtedy, kiedy jej potrzebuje.

Dwa podejścia do tej samej wiedzy

Dlaczego preload przegrywa

Retrieval jest tak dobry, jak to, co zwróci

Podejście hybrydowe — bo „prawie zawsze" to nie „zawsze"

Jak to wygląda w n8n

Co z tego wynika

Spis treści

Atlas znika po dziewięciu miesiącach — a jego najważniejsza lekcja jest o bezpieczeństwie, nie o rynku

Poza AI Act — czego ta mapa nie obejmuje (a co też jest prawem)

Firma jako podmiot stosujący — AI Act obowiązuje także tych, którzy niczego nie zbudowali

Oznaczanie treści generowanych przez AI — kto, co i od kiedy

Piramida ryzyka — jak AI Act klasyfikuje systemy i gdzie na niej ląduje typowa firma

Chatbot i agent na stronie a obowiązek przejrzystości — termin, który nie został przesunięty

Kalendarz AI Act po Digital Omnibus — co obowiązuje, co wchodzi, co przesunięto

Human-in-the-loop, który kłamie — jak zaprojektować okno zgody, które naprawdę chroni

AI Website Tycoon

Ekonomia widoczności — kto płaci za internet, który czytają maszyny

Agentic Web

Nawigacja

Bądź na bieżąco

Zapisz się na newsletter

Join the Newsletter

Czego szukasz?