Okno kontekstu to nie archiwum ani baza danych — to przestrzeń robocza modelu, dostępna wyłącznie podczas jednego wywołania. Wszystko, co ma wpłynąć na wynik, musi się w niej zmieścić. Wszystko, co się nie mieści, dla modelu nie istnieje.
Rozmiar okna kontekstu
Rozmiar mierzy się w tokenach — kawałkach tekstu odpowiadających mniej więcej sylabom lub krótkim słowom. Modele z 2025–2026 roku mają okna rzędu 128 000–1 000 000 tokenów. To brzmi jak dużo, ale agent w pętli wieloetapowej szybko je zapełnia: każda iteracja dociąga historię kroków, wyniki narzędzi i pobrane dane.
Okno to budżet, nie worek
Duże okno nie oznacza że warto je wypełniać. Im więcej treści, tym wyższy koszt wywołania, tym wolniejsza odpowiedź i tym większe ryzyko context rot — zjawiska, w którym ważna informacja ginie w szumie. Okno kontekstu traktuje się jak budżet do rozplanowania, nie jak przestrzeń do zapychania.
Co trafia do okna kontekstu agenta
Instrukcja systemowa, historia kroków pętli agenta, wyniki wywołanych narzędzi, dane pobrane przez retrieval, przykłady few-shot — wszystkie te warstwy dzielą ten sam skończony budżet. Context engineering to projekt decydujący, które warstwy dostają ile miejsca i kiedy.