Artykuł 3 z serii Anatomia Agenta AI Jak agent myśli — ReAct, Chain-of-Thought i pętla działania


Wyobraź sobie że zatrudniasz asystenta. Pierwszego dnia tłumaczysz mu wszystko: jak działasz, jakie są Twoje preferencje, na czym Ci zależy. Pracuje świetnie.

Następnego dnia przychodzi i nie pamięta nic. Zero. Musisz tłumaczyć od nowa.

Dokładnie tak działa model językowy bez mechanizmów pamięci. Każde wywołanie zaczyna od czystej kartki. Poprzednia rozmowa, decyzje z zeszłego tygodnia, kontekst który nabudowałeś przez miesiąc — znikają po zamknięciu sesji.

Dla chatbota to jest akceptowalne. Dla agenta który ma być użytecznym współpracownikiem przez miesiące — to jest fundamentalne ograniczenie. I jest to ograniczenie które można obejść.

Cztery typy pamięci agenta

Pamięć agenta to nie jedna rzecz. To cztery różne mechanizmy, każdy z innymi właściwościami i zastosowaniami. Rozróżnienie między nimi jest kluczowe — bo błędy przy projektowaniu pamięci agenta niemal zawsze wynikają z użycia złego typu do złego zadania.

1. Pamięć robocza — okno kontekstu

To wszystko co agent „widzi” teraz — aktualna sesja, historia kroków, wyniki narzędzi, instrukcja systemowa. Tak jak RAM w komputerze: błyskawiczny dostęp, ale znika gdy skończy się sesja.

Okno kontekstu ma konkretny rozmiar mierzony w tokenach. GPT-4o — 128 tysięcy tokenów. Claude Sonnet 4 — 200 tysięcy. Gemini 1.5 Pro — milion.

To brzmi jak dużo, ale przy długim zadaniu z wieloma krokami, wywołaniami narzędzi i pobranymi dokumentami — okno kontekstu wypełnia się szybciej niż myślisz. A gdy jest zapełnione, najstarsze informacje wypadają albo model gorzej korzysta z tego co leży „pośrodku” (zjawisko znane jako „lost in the middle” — model lepiej pamięta co jest na początku i końcu kontekstu niż w środku).

Pamięć robocza jest dobra do: aktualnego zadania, bieżącej sesji, danych które potrzebne są teraz.

Nie nadaje się do: przechowywania informacji między sesjami, skalowalnej historii, wiedzy firmowej.

2. Pamięć epizodyczna — wspomnienia zdarzeń

Agent skończył rozmowę z klientem. Omawialiście specyficzne wymagania, zapadły decyzje, pojawiły się niestandardowe warunki. Następnym razem gdy ten klient wróci — agent powinien to wiedzieć.

Pamięć epizodyczna to zewnętrzna baza (najczęściej wektorowa) gdzie zapisywane są konkretne zdarzenia i interakcje. Agent może przeszukiwać ją semantycznie: „co ustaliliśmy z klientem X w marcu?”, „jakie były problemy przy projekcie Y?”, „co ten użytkownik powiedział o swoich preferencjach?”

Kluczowa właściwość: nie musisz pamiętać słów kluczowych. Szukasz semantycznie — „cokolwiek dotyczyło harmonogramu projektu Y” — i baza wektorowa zwraca relevantne fragmenty.

To jest najpopularniejszy typ „długoterminowej pamięci” który deweloperzy implementują dla agentów. Narzędzia: Mem0, Zep, MemGPT — każde z nich zapewnia warstwę pamięci epizodycznej nad modelem.

3. Pamięć semantyczna — wiedza

Inne pytanie: agent obsługuje klientów firmy. Musi znać produkty, politykę cenową, warunki gwarancji, procedury reklamacji.

To nie są „wspomnienia” konkretnych zdarzeń. To jest wiedza deklaratywna — fakty, dokumenty, instrukcje. Przechowywana jako baza dokumentów, odpytywana przez RAG gdy agent potrzebuje konkretnej informacji.

Różnica między epizodyczną a semantyczną jest subtelna ale ważna: epizodyczna przechowuje „co się stało”, semantyczna przechowuje „jak jest”. Rozmowa z klientem — epizodyczna. Polityka zwrotów — semantyczna.

4. Pamięć proceduralna — umiejętności

Najtrudniejszy typ do zrozumienia, a często najcenniejszy w praktyce.

Agent wielokrotnie wykonuje ten sam typ zadania — powiedzmy analizuje umowy prawne i szuka klauzul ryzyka. Z czasem „uczy się” co szukać, jak to opisać, jakie wzorce pojawiają się najczęściej.

Ta wiedza proceduralna może być przechowywana jako:

  • Zaktualizowany system prompt z lepszymi instrukcjami
  • Przykłady few-shot w prompcie (przykład dobrej analizy + przykład złej)
  • Fine-tuning modelu na zadanych przykładach (zaawansowane)

Pamięć proceduralna sprawia że agent poprawia się z czasem — nie tylko „pamięta” co się działo, ale uczy się jak działać lepiej.

Przykład który pokazuje różnicę

Asystent bez pamięci długoterminowej — wersja „chatbot”:

Klient: „Pamiętasz że prosiłem żebyś zawsze formatował raporty jako bullet-pointy?” Asystent: „Niestety, nie mam dostępu do poprzednich rozmów…”

Ten sam asystent z pamięcią epizodyczną:

Klient: „Przygotuj mi podsumowanie spotkania.” Asystent: [pobiera z pamięci: „użytkownik preferuje bullet-pointy, unika długich akapitów, raporty ma dostawać rano”] „Oto podsumowanie:” → [bullet-pointy, zwięźle]

Różnica między tymi dwoma wersjami to nie model, nie prompt. To architektura pamięci.

Agent który „pamiętasz że…” jest fundamentalnie innym produktem niż chatbot który zaczyna od zera. I jest to przewaga której nie można uzyskać samym lepszym modelem.

Trzy błędy przy projektowaniu pamięci

Błąd 1: Wrzucanie wszystkiego do kontekstu.

Kusząca droga na skróty: zbierasz historię wszystkich rozmów i wklejasz do system promptu. Działa dla pierwszych kilku sesji. Potem kontekst jest pełen, koszty rosną, a model gorzej radzi sobie z informacjami zakopanymi w środku długiego kontekstu.

Właściwa architektura: przechowuj historię zewnętrznie, pobieraj relevantne fragmenty przy każdym zapytaniu — nie całość.

Błąd 2: Brak selektywności — zapamiętuj wszystko.

Agent zapamiętuje każdą wymienioną informację. Po miesiącu pamięć jest pełna szumu — nieważnych szczegółów, przestarzałych danych, sprzecznych informacji.

Właściwa architektura: agents z pamięcią powinny decydować co warte jest zapamiętania. Mem0 i podobne systemy mają wbudowaną logikę „co zapisać” zamiast zapisywać surowo każde zdanie.

Błąd 3: Ignorowanie bezpieczeństwa i GDPR.

Pamięć przechowuje dane użytkowników. Długoterminowo. To rodzi dwa problemy:

Context poisoning — atakujący może wstrzyknąć fałszywe „wspomnienie” do bazy wektorowej agenta. Przy kolejnym relevantnym zapytaniu agent pobierze zatrute dane i będzie działał na ich podstawie. Zewnętrzna pamięć to nowy wektor ataku który nie istniał przy chatbocie.

GDPR i prawo do bycia zapomnianym — użytkownik może zażądać usunięcia swoich danych. Czy potrafisz usunąć wszystkie dane konkretnego użytkownika z bazy wektorowej agenta? Nie jest to tak proste jak DELETE FROM users WHERE id=X. Wymaga przemyślanej architektury od początku.

Narzędzia które warto znać

Mem0 — dedykowana warstwa pamięci dla agentów. Inteligentna ekstrakcja „co zapamiętać” z rozmów, semantyczne przeszukiwanie historii, integracja z popularnymi frameworkami.

Zep — pamięć dla aplikacji konwersacyjnych. Automatyczna ekstrakcja faktów, preferencji i relacji z rozmów.

Claude Projects — wbudowana pamięć między sesjami w ramach jednego projektu. Najprościej do uruchomienia dla niedewelopera.

OpenAI Memory — pamięć w ChatGPT między sesjami. Prosta, transparentna (użytkownik widzi co model „zapamiętał”), ale zamknięta w ekosystemie OpenAI.

Microsoft Copilot — najszersza pamięć enterprise: łączy Outlook, Teams, SharePoint i Azure AI Search jako kontekst. Agent „wie” co było w mailach, na spotkaniach, w dokumentach. Dla firm w ekosystemie Microsoft — to naturalna droga.

Co to znaczy dla kogoś kto buduje agenta

Zanim napiszesz pierwszą linię kodu agenta — zdecyduj jakiej pamięci potrzebuje.

Jednorazowe zadanie bez kontynuacji? Pamięć robocza wystarczy. Asystent który wraca do tych samych tematów? Potrzebujesz pamięci epizodycznej. Agent obsługi klienta z bazą wiedzy firmowej? Semantyczna przez RAG. Agent który ma się poprawiać przez powtarzanie zadań? Pomyśl o pamięci proceduralnej.

I jeden wniosek którego się nie spodziewasz zanim przez to przejdziesz: pamięć to nie tylko techniczny problem. To problem produktowy. Agent który pamięta to inny UX, inne oczekiwania użytkownika i inne ryzyko gdy coś pójdzie nie tak. Zanim wdrożysz — zastanów się co agent powinien pamiętać, co powinien zapomnieć, i jak użytkownik może to kontrolować.

W następnym artykule: dość teorii. Budujemy pierwszego agenta bez linii kodu — n8n, praktyczny workflow od zera i przykład który możesz uruchomić jeszcze dziś.


Pojęcia ze słownika: Agent memory · Context window · RAG · Context poisoning · Enterprise RAG · Agent loop

Spis treści

Google Antigravity 2.0 — opis narzędzia

Google Antigravity 2.0 — opis narzędzia

Platforma Google do orkiestrowania wielu agentów AI — ogłoszona na Google I/O 19 maja 2026. Antigravity 1.0 (listopad 2025) był IDE konkurującym z Cursor. Antigravity 2.0 wyszedł z tej kategorii — to nie jest narzędzie do pisania kodu z pomocą AI, to platforma do...