Człowiek który wykonuje zadanie pracuje w pętli. Obserwuje sytuację. Planuje co zrobić. Wykonuje akcję. Obserwuje wynik. Koryguje plan. Wykonuje kolejną akcję. Powtarza aż zadanie jest skończone lub uzna że nie może go skończyć.
Agent AI działa na tej samej zasadzie — przez pętlę percepcja-planowanie-akcja która powtarza się aż cel zostanie osiągnięty.
To jest agent loop.
Czym jest agent loop
Agent loop to podstawowy cykl działania autonomicznego agenta AI — powtarzająca się sekwencja percepcji (co widzę, jaki jest stan), planowania (co powinienem zrobić), akcji (wywołanie narzędzia, wykonanie operacji) i oceny wyniku (czy cel został osiągnięty, co jest następnym krokiem) — która kontynuuje się aż agent osiągnie cel, napotka nierozwiązywalną przeszkodę lub zostanie zatrzymany przez człowieka.
Cztery kroki pętli
Percepcja: agent zbiera informacje o aktualnym stanie. Co jest w oknie kontekstu? Jakie są wyniki poprzednich akcji? Co zwróciło narzędzie? Jaki jest cel?
Planowanie: na podstawie percepcji agent decyduje co zrobić dalej. Czy cel jest osiągnięty? Jeśli nie — jaka akcja przybliży mnie do celu? Reasoning models spędzają więcej czasu na tym kroku — „myślą” zanim działają.
Akcja: agent wykonuje zaplanowaną akcję. Wywołuje narzędzie MCP, wykonuje zapytanie do bazy danych, wysyła request HTTP, pisze plik, wysyła wiadomość.
Ocena: agent patrzy na wynik akcji. Czy to przybliżyło mnie do celu? Co jest teraz stanem systemu? Czy mogę przejść do następnego kroku? Czy napotkałem błąd który wymaga innej strategii?
Nieskończona pętla jako failure mode
Agent loop może wpaść w nieskończoną pętlę gdy: cel jest źle zdefiniowany i agent nie ma kryterium sukcesu, narzędzie zawodzi i agent próbuje nieskończenie, agent interpretuje swój cel w sposób który zawsze wymaga kolejnej akcji.
Dobre systemy agentowe mają limity iteracji — maksymalna liczba kroków po której agent zatrzymuje się i raportuje do człowieka zamiast działać w nieskończoność. To jest krytyczne dla systemów produkcyjnych — agent bez limitu może konsumować zasoby i wywoływać narzędzia przez godziny bez żadnego użytecznego wyniku.
ReAct jako wzorzec
ReAct (Reasoning + Acting) to popularny wzorzec implementacji agent loop który przeplatuje kroki rozumowania („myślę że powinienem najpierw sprawdzić X”) z krokami działania („wywołuję narzędzie Y”). Wzorzec jest otwarty i powszechnie używany w implementacjach agentów od 2023 roku.
Agent loop a human-in-the-loop
Human-in-the-loop wbudowany w agent loop: agent wykonuje akcje autonomicznie, ale zatrzymuje się przed akcjami o wysokim ryzyku i pyta człowieka o potwierdzenie. Człowiek jest punktem kontrolnym w pętli, nie obserwatorem z zewnątrz. To jest bardziej efektywne niż zatrzymywanie agenta po każdym kroku — agent sam ocenia które kroki wymagają zatwierdzenia.