zgubione w środku

Zjawisko, w którym informacja umieszczona w środku długiego okna kontekstu jest obsługiwana gorzej niż ta na jego początku i końcu.

W Polsce nazywane też:

zgubione w środku

Lost in the middle to efekt dokumentowany empirycznie w badaniach nad modelami językowymi: gdy do okna kontekstu trafia długi dokument lub wiele dokumentów, model lepiej radzi sobie z informacją umieszczoną na początku i końcu niż tą w środku.

Nierówna uwaga modelu

Modele językowe nie przetwarzają sekwencji tokenów z równą uwagą. Mechanizm attention ma tendencję do skupiania się na pierwszych i ostatnich elementach sekwencji — środkowe fragmenty długiego kontekstu są obsługiwane gorzej, nawet jeśli zawierają kluczową informację.

Implikacje dla architektury kontekstu

Kolejność, w jakiej układasz informacje w oknie, ma mierzalny wpływ na wynik — nie tylko to, czy informacja w ogóle jest w kontekście. Najważniejsze dane (instrukcja, kluczowy fakt, cel zadania) powinny znaleźć się na początku lub końcu okna — nie w środku długiego bloku tekstu.

Praktyczna zasada

Jeśli nie masz pewności gdzie umieścić ważny fragment — umieść go na początku. Jeśli musisz użyć wielu dokumentów — rozważ ich streszczenie lub selekcję zamiast sekwencyjnego układania w jednym bloku.

Powiązane pojęcia

gnicie kontekstuDegradacja jakości odpowiedzi modelu w miarę zapychania okna nieistotną treścią. Im więcej szumu, tym trudniej modelowi wyłowić sygnał.okno kontekstuMaksymalna ilość tekstu, liczona w tokenach, którą model może mieć „przed oczami" w jednym wywołaniu. Skończony budżet, w którym muszą zmieścić się wszystkie warstwy kontekstu.

Artykuły na webflux.pl

agentic-web/context-engineering/okno-kontekstu-budzet-tokenow-i-context-rot