Prompt engineering pytał: jak sformułować jedno zapytanie? Context engineering pyta: co w ogóle powinno znaleźć się w oknie — i w jakiej formie, ilości i kolejności?
Gdy modele językowe były chatbotami, kontekst był prosty: pytanie użytkownika i opcjonalnie krótka instrukcja systemowa. Gdy modele stały się agentami działającymi w wieloetapowych pętlach, okno kontekstu zapełniło się warstwami: instrukcją operatora, historią kroków, wynikami narzędzi, pobranymi dokumentami, przykładami few-shot, stanem pamięci. To nie jest już jeden prompt — to projekt architektoniczny.
Pięć warstw okna kontekstu agenta
Instrukcja systemowa — stała warstwa operatora, kim agent jest i czego nie robi. Historia kroków — co zostało zrobione w tej sesji, jakie decyzje zapadły. Wyniki narzędzi — to co agent pobrał, obliczył lub wykonał. Wiedza zewnętrzna — dokumenty pobrane przez retrieval, dane z baz. Przykłady — few-shot pokazujące jak wygląda pożądany wynik.
Każda warstwa zajmuje budżet tokenów. Budżet jest skończony. Context engineering to decyzja, które warstwy dostają ile miejsca i kiedy.
Czemu prompt engineering to za mało
Prompt engineering zakłada że wynik zależy od sformułowania zapytania. W agentach wynik zależy od tego, czy model ma przy danym kroku właściwe informacje — a nie od tego, jak je poprosisz. Pięknie napisany prompt w oknie pełnym szumu wypada gorzej niż prosty prompt w czystym, dobrze skomponowanym kontekście.