Co wrzucić do kontekstu, a co odciąć — anatomia okna agenta

Okno to nie jeden tekst.

To pięć warstw walczących o to samo miejsce.

W poprzednim wpisie ustaliliśmy, że okno kontekstu jest budżetem, nie workiem. Zostało pytanie, które każdy buduje sobie sam przy pierwszym agencie: skoro budżet jest skończony — co konkretnie do niego wpuścić?

Żeby na to odpowiedzieć, trzeba zobaczyć, że to, co model dostaje na wejściu, nie jest jednym blokiem. To kilka różnych źródeł sklejonych w jedno okno. Pillar wymienił je z nazwy — tu rozkładamy każde na części i dla każdego odpowiadamy na trzy pytania: trzymać na stałe, odciąć, czy pobrać dopiero gdy potrzebne. Bo na tym polega cała robota.

Pięć warstw okna

Wyobraź sobie okno jako stos. Od dołu, od fundamentu, do tego, co dosypujesz przy każdym kroku.

1. System prompt — fundament, ale tylko fundament

Najniższa warstwa: kim agent jest, co wolno, czego nie, jak ma się zachować. Siedzi w oknie cały czas, przy każdym obrocie pętli. I to jest jej zaleta i jej koszt naraz — to, co tu włożysz, płacisz w każdej iteracji.

Stąd zasada: system prompt ma być stabilny i zwięzły, nie magazynem wiedzy. Pokusa, żeby wkleić tu całą dokumentację „żeby agent zawsze miał”, jest dokładnie tym błędem, który tworzy context rot z C1. Wiedza, która zmienia się zależnie od kroku, nie należy do fundamentu — należy do warstw wyższych. Dlaczego system prompt to nie to samo co zwykłe pytanie i co naprawdę powinien zawierać, rozkłada osobny artykuł serii.

Decyzja: trzymać na stałe — ale chudo.

2. Pamięć — co agent wie z wcześniejszych kroków

Druga warstwa to historia: co agent już zrobił, co zwróciły poprzednie akcje, co ustalił w tej i w poprzednich sesjach. To zwykle najszybciej puchnąca część okna — i pierwsza, która wywołuje context rot, jeśli wleczesz ją w całości.

Klucz to rozróżnienie, które typy pamięci w ogóle trzymasz w oknie, a które poza nim. Świeże, istotne kroki — w pełnej formie. Starsze — skompresowane do streszczenia. Rzeczy trwałe, do których agent sięga rzadko — poza oknem, do pobrania na żądanie. To wszystko zależy od projektu pamięci, a cztery jej typy rozstrzygają, co gdzie ląduje.

Decyzja: trzymać selektywnie — świeże w pełni, stare streszczone, resztę pobierać.

3. Wyniki narzędzi — to, co wróciło z akcji

Gdy agent wywoła narzędzie — odpyta bazę, uderzy w API, zrobi request — wynik tej akcji wraca do okna, żeby model mógł na nim oprzeć następny krok. I tu jest pułapka, którą widać u każdego początkującego: surowy dump. Pełny JSON z pięćdziesięcioma polami, gdy istotne są trzy.

Surowy wynik narzędzia to nie kontekst — to materiał na kontekst. Zanim wróci do okna, warto go przyciąć i sformatować do tego, co krok faktycznie potrzebuje. (Temu poświęcimy osobny wpis tej kategorii — o formatowaniu wyników i structured output.)

Decyzja: wpuszczać przefiltrowane, nigdy surowe w całości.

4. Retrieval — dane pobrane na potrzebę kroku

Czwarta warstwa to wiedza, której agent nie ma „w sobie” ani w pamięci: dokumentacja, baza wiedzy, dane produktowe, polityki. Kuszące jest wepchnąć to wszystko do okna na start. Lepsze podejście jest odwrotne: pobierać dopiero wtedy, gdy konkretny krok tego wymaga — i tylko ten fragment, który jest istotny.

To jest serce różnicy „wszystko z góry” kontra just-in-time. Mechanikę pobierania rozkłada wpis o RAG; jak to przekłada się na zarządzanie oknem — osobny wpis tej kategorii o retrievalu jako składaniu kontekstu.

Decyzja: prawie zawsze pobierać na żądanie, nie trzymać.

5. Przykłady — wzorce, czego od modelu chcesz

Najwyższa warstwa: few-shot, czyli przykłady pokazujące modelowi pożądany format i styl odpowiedzi. Potrafią dramatycznie poprawić jakość — i równie dramatycznie zjeść budżet, jeśli wrzucisz ich pięć tam, gdzie wystarczy jeden.

Po samą głębię promptowania — jak dobierać przykłady, jak utrzymać powtarzalność — odsyłamy do promptujemy.pl, gdzie ten wątek prowadzimy jako działający PoC. Tu pytanie jest węższe: ile przykładów zmieści się w oknie obok czterech pozostałych warstw, nie wypychając rzeczy ważniejszych. (Sam dobór przykładów — w osobnym wpisie tej kategorii o few-shot.)

Decyzja: wpuszczać oszczędnie — tyle, ile realnie zmienia wynik.

Heurystyka: trzymać, odciąć, pobrać

Gdy nie wiesz, co zrobić z danym blokiem, zadaj trzy pytania po kolei:

Czy model potrzebuje tego przy każdym kroku? Jeśli tak — to fundament, trzymaj (ale chudo). Jeśli nie — idź dalej.

Czy potrzebuje tego teraz, przy tym kroku? Jeśli tak — wpuść, ale przefiltrowane do istoty. Jeśli nie — idź dalej.

Czy może potrzebować tego czasem? Jeśli tak — zostaw poza oknem i pobierz na żądanie. Jeśli odpowiedź na wszystkie trzy brzmi „raczej nie” — to nie jest kontekst, to szum. Odetnij.

Ta heurystyka jest cała. Reszta to wprawa.

Krótko dla twórców treści

Jeśli używasz LLM nie do agenta, tylko do generowania treści — opisów produktów, altów, wariantów nagłówków — te same warstwy działają, tylko w mniejszej skali. Twój „system prompt” to stała instrukcja o tonie i marce. Twój „retrieval” to dane konkretnego produktu, które wklejasz akurat do tego zadania. Twoje „przykłady” to dwa-trzy wzorcowe opisy pokazujące styl. Reguła jest identyczna: do okna trafia to, co istotne dla tego tekstu — nie cała baza wiedzy o firmie „na wszelki wypadek”. Mniej, ale celniej, daje lepszy i powtarzalny wynik.

Co z tego wynika

Okno agenta nie jest tekstem, który piszesz. Jest stosem, który komponujesz — pięć warstw rywalizujących o ten sam, skończony budżet z C1. Twoja robota to nie „napisać dobry prompt”, tylko przy każdym kroku rozstrzygnąć, które warstwy wchodzą, w jakiej formie i ile ich.

Mając już mapę warstw, kolejne wpisy tej kategorii schodzą po niej w dół: jak pobierać (retrieval), jak nie gubić wątku, gdy pamięć rośnie (kompakcja), jak formatować to, co wraca z narzędzi, i jak dobierać przykłady. Każdy z nich to po prostu jedna warstwa tego stosu, rozłożona na czynniki.

Pojęcia ze słownika: Okno kontekstu · System prompt vs user prompt · Few-shot · Just-in-time retrieval · Structured output · Grounding

Sprawdź słownik pojęć Agentic-Web

Przejdź do Strefy Divi

Spis treści

Atlas znika po dziewięciu miesiącach — a jego najważniejsza lekcja jest o bezpieczeństwie, nie o rynku

przez Łukasz | lip 13, 2026 | Agentic Web

OpenAI wygasza ChatGPT Atlas 9 sierpnia 2026. To dobry moment, żeby zapytać, dlaczego agentowa przeglądarka okazała się trudniejsza, niż wyglądała — i dlaczego problem nie zniknie razem z produktem. 9 lipca 2026 OpenAI ogłosił, że ChatGPT Atlas — dedykowana...

Poza AI Act — czego ta mapa nie obejmuje (a co też jest prawem)

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna — a ta konkretna strona jest mapą granic mapy: pokazuje terytoria, których hub świadomie nie opisuje, żeby nikt nie pomylił jego zasięgu z zasięgiem prawa. Data ostatniej weryfikacji treści: lipiec 2026. AI Act jest regulacją nową...

AI Act nie dzieli świata na Big Tech i resztę — dzieli na role: dostawca i podmiot stosujący. Firma używająca kupionego narzędzia AI ma własną rolę i własne obowiązki. Mapa tej roli

Firma jako podmiot stosujący — AI Act obowiązuje także tych, którzy niczego nie zbudowali

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję ról z tekstu rozporządzenia. Jaką rolę pełni Twoja firma wobec konkretnego systemu i jakie obowiązki z niej wynikają — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. AI Act przypisuje...

Oznaczanie treści generowanych przez AI — kto, co i od kiedy

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję obowiązków z art. 50 AI Act według tekstu przepisów i publicznie dostępnych projektów wytycznych. Czy i jak dotyczą Twoich treści — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. AI Act...

Piramida ryzyka — jak AI Act klasyfikuje systemy i gdzie na niej ląduje typowa firma

przez Łukasz | lip 12, 2026 | Agentic Web, Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję klasyfikacji z tekstu rozporządzenia. Do którego poziomu należy konkretny system w konkretnym użyciu — rozstrzyga analiza prawna, nie mapa. Data ostatniej weryfikacji treści: lipiec 2026. AI Act nie reguluje...

Chatbot i agent na stronie a obowiązek przejrzystości — termin, który nie został przesunięty

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy, co wynika z tekstu art. 50 AI Act i publicznie dostępnych wytycznych. Czy i jak przepis stosuje się do Twojego konkretnego wdrożenia — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. Od 2 sierpnia...

Kalendarz AI Act po Digital Omnibus — co obowiązuje, co wchodzi, co przesunięto

przez Łukasz | lip 11, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy terminy i kategorie wynikające z tekstu przepisów. Czy i jak dotyczą Twojego przypadku — rozstrzyga prawnik znający Twoją sytuację. Data ostatniej weryfikacji treści: lipiec 2026; przepisy w tym obszarze zmieniały się w...

Human-in-the-loop, który kłamie — jak zaprojektować okno zgody, które naprawdę chroni

przez Łukasz | lip 11, 2026 | Anatomia agenta AI

Dodałeś potwierdzenie przez człowieka. To nie znaczy, że dodałeś zabezpieczenie. Kiedy budujesz agenta, który robi coś nieodwracalnego — pisze pliki, wykonuje polecenia, wysyła pieniądze — prędzej czy później dokładasz punkt kontrolny: zanim agent to zrobi, pyta...

AI Website Tycoon

przez Łukasz | lip 9, 2026 | Gry

👑 AI WEBSITE TYCOON Symulator agencji stron przyszłości Rok 2025 Budżet 100 000 zł ⛶ 1 · Klient 2 · Budżet 3 · Wydarzenia 4 · Wyniki 5 · Raport AI Zbuduj stronę, którą poleci AI — nie tylko taką, która ładnie wygląda. Dostajesz klienta i 100 000 zł. Twoje...

Ekonomia widoczności — kto płaci za internet, który czytają maszyny

przez Łukasz | lip 9, 2026 | AI Visibility

Otwarty internet stał przez dwie dekady na niepisanej umowie: twórca oddaje treść do indeksowania, wyszukiwarka odsyła w zamian ruch, ruch monetyzuje się reklamą, sprzedażą albo marką. Systemy AI tę umowę łamią w połowie — czytają treść jak nikt wcześniej, ale...

« Starsze Wpisy

Co wrzucić do kontekstu, a co odciąć — anatomia okna agenta

Okno to nie jeden tekst.

To pięć warstw walczących o to samo miejsce.

Pięć warstw okna

1. System prompt — fundament, ale tylko fundament

2. Pamięć — co agent wie z wcześniejszych kroków

3. Wyniki narzędzi — to, co wróciło z akcji

4. Retrieval — dane pobrane na potrzebę kroku

5. Przykłady — wzorce, czego od modelu chcesz

Heurystyka: trzymać, odciąć, pobrać

Krótko dla twórców treści

Co z tego wynika

Spis treści

Atlas znika po dziewięciu miesiącach — a jego najważniejsza lekcja jest o bezpieczeństwie, nie o rynku

Poza AI Act — czego ta mapa nie obejmuje (a co też jest prawem)

Firma jako podmiot stosujący — AI Act obowiązuje także tych, którzy niczego nie zbudowali

Oznaczanie treści generowanych przez AI — kto, co i od kiedy

Piramida ryzyka — jak AI Act klasyfikuje systemy i gdzie na niej ląduje typowa firma

Chatbot i agent na stronie a obowiązek przejrzystości — termin, który nie został przesunięty

Kalendarz AI Act po Digital Omnibus — co obowiązuje, co wchodzi, co przesunięto

Human-in-the-loop, który kłamie — jak zaprojektować okno zgody, które naprawdę chroni

AI Website Tycoon

Ekonomia widoczności — kto płaci za internet, który czytają maszyny

Agentic Web

Nawigacja

Bądź na bieżąco

Zapisz się na newsletter

Join the Newsletter

Czego szukasz?