okno kontekstu

Maksymalna ilość tekstu, liczona w tokenach, którą model może mieć „przed oczami" w jednym wywołaniu. Skończony budżet, w którym muszą zmieścić się wszystkie warstwy kontekstu.

W Polsce nazywane też:

okno kontekstu

Okno kontekstu to nie archiwum ani baza danych — to przestrzeń robocza modelu, dostępna wyłącznie podczas jednego wywołania. Wszystko, co ma wpłynąć na wynik, musi się w niej zmieścić. Wszystko, co się nie mieści, dla modelu nie istnieje.

Rozmiar okna kontekstu

Rozmiar mierzy się w tokenach — kawałkach tekstu odpowiadających mniej więcej sylabom lub krótkim słowom. Modele z 2025–2026 roku mają okna rzędu 128 000–1 000 000 tokenów. To brzmi jak dużo, ale agent w pętli wieloetapowej szybko je zapełnia: każda iteracja dociąga historię kroków, wyniki narzędzi i pobrane dane.

Okno to budżet, nie worek

Duże okno nie oznacza że warto je wypełniać. Im więcej treści, tym wyższy koszt wywołania, tym wolniejsza odpowiedź i tym większe ryzyko context rot — zjawiska, w którym ważna informacja ginie w szumie. Okno kontekstu traktuje się jak budżet do rozplanowania, nie jak przestrzeń do zapychania.

Co trafia do okna kontekstu agenta

Instrukcja systemowa, historia kroków pętli agenta, wyniki wywołanych narzędzi, dane pobrane przez retrieval, przykłady few-shot — wszystkie te warstwy dzielą ten sam skończony budżet. Context engineering to projekt decydujący, które warstwy dostają ile miejsca i kiedy.