Jak agent pamięta — cztery typy pamięci i dlaczego to zmienia wszystko

Artykuł 3 z serii Anatomia Agenta AI ← Jak agent myśli — ReAct, Chain-of-Thought i pętla działania

Wyobraź sobie że zatrudniasz asystenta. Pierwszego dnia tłumaczysz mu wszystko: jak działasz, jakie są Twoje preferencje, na czym Ci zależy. Pracuje świetnie.

Następnego dnia przychodzi i nie pamięta nic. Zero. Musisz tłumaczyć od nowa.

Dokładnie tak działa model językowy bez mechanizmów pamięci. Każde wywołanie zaczyna od czystej kartki. Poprzednia rozmowa, decyzje z zeszłego tygodnia, kontekst który nabudowałeś przez miesiąc — znikają po zamknięciu sesji.

Dla chatbota to jest akceptowalne. Dla agenta który ma być użytecznym współpracownikiem przez miesiące — to jest fundamentalne ograniczenie. I jest to ograniczenie które można obejść.

Cztery typy pamięci agenta

Pamięć agenta to nie jedna rzecz. To cztery różne mechanizmy, każdy z innymi właściwościami i zastosowaniami. Rozróżnienie między nimi jest kluczowe — bo błędy przy projektowaniu pamięci agenta niemal zawsze wynikają z użycia złego typu do złego zadania.

1. Pamięć robocza — okno kontekstu

To wszystko co agent „widzi” teraz — aktualna sesja, historia kroków, wyniki narzędzi, instrukcja systemowa. Tak jak RAM w komputerze: błyskawiczny dostęp, ale znika gdy skończy się sesja.

Okno kontekstu ma konkretny rozmiar mierzony w tokenach. GPT-4o — 128 tysięcy tokenów. Claude Sonnet 4 — 200 tysięcy. Gemini 1.5 Pro — milion.

To brzmi jak dużo, ale przy długim zadaniu z wieloma krokami, wywołaniami narzędzi i pobranymi dokumentami — okno kontekstu wypełnia się szybciej niż myślisz. A gdy jest zapełnione, najstarsze informacje wypadają albo model gorzej korzysta z tego co leży „pośrodku” (zjawisko znane jako „lost in the middle” — model lepiej pamięta co jest na początku i końcu kontekstu niż w środku).

Pamięć robocza jest dobra do: aktualnego zadania, bieżącej sesji, danych które potrzebne są teraz.

Nie nadaje się do: przechowywania informacji między sesjami, skalowalnej historii, wiedzy firmowej.

2. Pamięć epizodyczna — wspomnienia zdarzeń

Agent skończył rozmowę z klientem. Omawialiście specyficzne wymagania, zapadły decyzje, pojawiły się niestandardowe warunki. Następnym razem gdy ten klient wróci — agent powinien to wiedzieć.

Pamięć epizodyczna to zewnętrzna baza (najczęściej wektorowa) gdzie zapisywane są konkretne zdarzenia i interakcje. Agent może przeszukiwać ją semantycznie: „co ustaliliśmy z klientem X w marcu?”, „jakie były problemy przy projekcie Y?”, „co ten użytkownik powiedział o swoich preferencjach?”

Kluczowa właściwość: nie musisz pamiętać słów kluczowych. Szukasz semantycznie — „cokolwiek dotyczyło harmonogramu projektu Y” — i baza wektorowa zwraca relevantne fragmenty.

To jest najpopularniejszy typ „długoterminowej pamięci” który deweloperzy implementują dla agentów. Narzędzia: Mem0, Zep, MemGPT — każde z nich zapewnia warstwę pamięci epizodycznej nad modelem.

3. Pamięć semantyczna — wiedza

Inne pytanie: agent obsługuje klientów firmy. Musi znać produkty, politykę cenową, warunki gwarancji, procedury reklamacji.

To nie są „wspomnienia” konkretnych zdarzeń. To jest wiedza deklaratywna — fakty, dokumenty, instrukcje. Przechowywana jako baza dokumentów, odpytywana przez RAG gdy agent potrzebuje konkretnej informacji.

Różnica między epizodyczną a semantyczną jest subtelna ale ważna: epizodyczna przechowuje „co się stało”, semantyczna przechowuje „jak jest”. Rozmowa z klientem — epizodyczna. Polityka zwrotów — semantyczna.

4. Pamięć proceduralna — umiejętności

Najtrudniejszy typ do zrozumienia, a często najcenniejszy w praktyce.

Agent wielokrotnie wykonuje ten sam typ zadania — powiedzmy analizuje umowy prawne i szuka klauzul ryzyka. Z czasem „uczy się” co szukać, jak to opisać, jakie wzorce pojawiają się najczęściej.

Ta wiedza proceduralna może być przechowywana jako:

Zaktualizowany system prompt z lepszymi instrukcjami
Przykłady few-shot w prompcie (przykład dobrej analizy + przykład złej)
Fine-tuning modelu na zadanych przykładach (zaawansowane)

Pamięć proceduralna sprawia że agent poprawia się z czasem — nie tylko „pamięta” co się działo, ale uczy się jak działać lepiej.

Przykład który pokazuje różnicę

Asystent bez pamięci długoterminowej — wersja „chatbot”:

Klient: „Pamiętasz że prosiłem żebyś zawsze formatował raporty jako bullet-pointy?” Asystent: „Niestety, nie mam dostępu do poprzednich rozmów…”

Ten sam asystent z pamięcią epizodyczną:

Klient: „Przygotuj mi podsumowanie spotkania.” Asystent: [pobiera z pamięci: „użytkownik preferuje bullet-pointy, unika długich akapitów, raporty ma dostawać rano”] „Oto podsumowanie:” → [bullet-pointy, zwięźle]

Różnica między tymi dwoma wersjami to nie model, nie prompt. To architektura pamięci.

Agent który „pamiętasz że…” jest fundamentalnie innym produktem niż chatbot który zaczyna od zera. I jest to przewaga której nie można uzyskać samym lepszym modelem.

Trzy błędy przy projektowaniu pamięci

Błąd 1: Wrzucanie wszystkiego do kontekstu.

Kusząca droga na skróty: zbierasz historię wszystkich rozmów i wklejasz do system promptu. Działa dla pierwszych kilku sesji. Potem kontekst jest pełen, koszty rosną, a model gorzej radzi sobie z informacjami zakopanymi w środku długiego kontekstu.

Właściwa architektura: przechowuj historię zewnętrznie, pobieraj relevantne fragmenty przy każdym zapytaniu — nie całość.

Błąd 2: Brak selektywności — zapamiętuj wszystko.

Agent zapamiętuje każdą wymienioną informację. Po miesiącu pamięć jest pełna szumu — nieważnych szczegółów, przestarzałych danych, sprzecznych informacji.

Właściwa architektura: agents z pamięcią powinny decydować co warte jest zapamiętania. Mem0 i podobne systemy mają wbudowaną logikę „co zapisać” zamiast zapisywać surowo każde zdanie.

Błąd 3: Ignorowanie bezpieczeństwa i GDPR.

Pamięć przechowuje dane użytkowników. Długoterminowo. To rodzi dwa problemy:

Context poisoning — atakujący może wstrzyknąć fałszywe „wspomnienie” do bazy wektorowej agenta. Przy kolejnym relevantnym zapytaniu agent pobierze zatrute dane i będzie działał na ich podstawie. Zewnętrzna pamięć to nowy wektor ataku który nie istniał przy chatbocie.

GDPR i prawo do bycia zapomnianym — użytkownik może zażądać usunięcia swoich danych. Czy potrafisz usunąć wszystkie dane konkretnego użytkownika z bazy wektorowej agenta? Nie jest to tak proste jak DELETE FROM users WHERE id=X. Wymaga przemyślanej architektury od początku.

Narzędzia które warto znać

Mem0 — dedykowana warstwa pamięci dla agentów. Inteligentna ekstrakcja „co zapamiętać” z rozmów, semantyczne przeszukiwanie historii, integracja z popularnymi frameworkami.

Zep — pamięć dla aplikacji konwersacyjnych. Automatyczna ekstrakcja faktów, preferencji i relacji z rozmów.

Claude Projects — wbudowana pamięć między sesjami w ramach jednego projektu. Najprościej do uruchomienia dla niedewelopera.

OpenAI Memory — pamięć w ChatGPT między sesjami. Prosta, transparentna (użytkownik widzi co model „zapamiętał”), ale zamknięta w ekosystemie OpenAI.

Microsoft Copilot — najszersza pamięć enterprise: łączy Outlook, Teams, SharePoint i Azure AI Search jako kontekst. Agent „wie” co było w mailach, na spotkaniach, w dokumentach. Dla firm w ekosystemie Microsoft — to naturalna droga.

Co to znaczy dla kogoś kto buduje agenta

Zanim napiszesz pierwszą linię kodu agenta — zdecyduj jakiej pamięci potrzebuje.

Jednorazowe zadanie bez kontynuacji? Pamięć robocza wystarczy. Asystent który wraca do tych samych tematów? Potrzebujesz pamięci epizodycznej. Agent obsługi klienta z bazą wiedzy firmowej? Semantyczna przez RAG. Agent który ma się poprawiać przez powtarzanie zadań? Pomyśl o pamięci proceduralnej.

I jeden wniosek którego się nie spodziewasz zanim przez to przejdziesz: pamięć to nie tylko techniczny problem. To problem produktowy. Agent który pamięta to inny UX, inne oczekiwania użytkownika i inne ryzyko gdy coś pójdzie nie tak. Zanim wdrożysz — zastanów się co agent powinien pamiętać, co powinien zapomnieć, i jak użytkownik może to kontrolować.

W następnym artykule: dość teorii. Budujemy pierwszego agenta bez linii kodu — n8n, praktyczny workflow od zera i przykład który możesz uruchomić jeszcze dziś.

Pojęcia ze słownika: Agent memory · Context window · RAG · Context poisoning · Enterprise RAG · Agent loop

Sprawdź słownik pojęć Agentic-Web

Przejdź do Strefy Divi

Spis treści

Atlas znika po dziewięciu miesiącach — a jego najważniejsza lekcja jest o bezpieczeństwie, nie o rynku

przez Łukasz | lip 13, 2026 | Agentic Web

OpenAI wygasza ChatGPT Atlas 9 sierpnia 2026. To dobry moment, żeby zapytać, dlaczego agentowa przeglądarka okazała się trudniejsza, niż wyglądała — i dlaczego problem nie zniknie razem z produktem. 9 lipca 2026 OpenAI ogłosił, że ChatGPT Atlas — dedykowana...

Poza AI Act — czego ta mapa nie obejmuje (a co też jest prawem)

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna — a ta konkretna strona jest mapą granic mapy: pokazuje terytoria, których hub świadomie nie opisuje, żeby nikt nie pomylił jego zasięgu z zasięgiem prawa. Data ostatniej weryfikacji treści: lipiec 2026. AI Act jest regulacją nową...

AI Act nie dzieli świata na Big Tech i resztę — dzieli na role: dostawca i podmiot stosujący. Firma używająca kupionego narzędzia AI ma własną rolę i własne obowiązki. Mapa tej roli

Firma jako podmiot stosujący — AI Act obowiązuje także tych, którzy niczego nie zbudowali

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję ról z tekstu rozporządzenia. Jaką rolę pełni Twoja firma wobec konkretnego systemu i jakie obowiązki z niej wynikają — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. AI Act przypisuje...

Oznaczanie treści generowanych przez AI — kto, co i od kiedy

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję obowiązków z art. 50 AI Act według tekstu przepisów i publicznie dostępnych projektów wytycznych. Czy i jak dotyczą Twoich treści — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. AI Act...

Piramida ryzyka — jak AI Act klasyfikuje systemy i gdzie na niej ląduje typowa firma

przez Łukasz | lip 12, 2026 | Agentic Web, Ai Act

To mapa regulacji, nie porada prawna. Opisujemy konstrukcję klasyfikacji z tekstu rozporządzenia. Do którego poziomu należy konkretny system w konkretnym użyciu — rozstrzyga analiza prawna, nie mapa. Data ostatniej weryfikacji treści: lipiec 2026. AI Act nie reguluje...

Chatbot i agent na stronie a obowiązek przejrzystości — termin, który nie został przesunięty

przez Łukasz | lip 12, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy, co wynika z tekstu art. 50 AI Act i publicznie dostępnych wytycznych. Czy i jak przepis stosuje się do Twojego konkretnego wdrożenia — rozstrzyga prawnik. Data ostatniej weryfikacji treści: lipiec 2026. Od 2 sierpnia...

Kalendarz AI Act po Digital Omnibus — co obowiązuje, co wchodzi, co przesunięto

przez Łukasz | lip 11, 2026 | Ai Act

To mapa regulacji, nie porada prawna. Opisujemy terminy i kategorie wynikające z tekstu przepisów. Czy i jak dotyczą Twojego przypadku — rozstrzyga prawnik znający Twoją sytuację. Data ostatniej weryfikacji treści: lipiec 2026; przepisy w tym obszarze zmieniały się w...

Human-in-the-loop, który kłamie — jak zaprojektować okno zgody, które naprawdę chroni

przez Łukasz | lip 11, 2026 | Anatomia agenta AI

Dodałeś potwierdzenie przez człowieka. To nie znaczy, że dodałeś zabezpieczenie. Kiedy budujesz agenta, który robi coś nieodwracalnego — pisze pliki, wykonuje polecenia, wysyła pieniądze — prędzej czy później dokładasz punkt kontrolny: zanim agent to zrobi, pyta...

AI Website Tycoon

przez Łukasz | lip 9, 2026 | Gry

👑 AI WEBSITE TYCOON Symulator agencji stron przyszłości Rok 2025 Budżet 100 000 zł ⛶ 1 · Klient 2 · Budżet 3 · Wydarzenia 4 · Wyniki 5 · Raport AI Zbuduj stronę, którą poleci AI — nie tylko taką, która ładnie wygląda. Dostajesz klienta i 100 000 zł. Twoje...

Ekonomia widoczności — kto płaci za internet, który czytają maszyny

przez Łukasz | lip 9, 2026 | AI Visibility

Otwarty internet stał przez dwie dekady na niepisanej umowie: twórca oddaje treść do indeksowania, wyszukiwarka odsyła w zamian ruch, ruch monetyzuje się reklamą, sprzedażą albo marką. Systemy AI tę umowę łamią w połowie — czytają treść jak nikt wcześniej, ale...

« Starsze Wpisy

Jak agent pamięta — cztery typy pamięci i dlaczego to zmienia wszystko

Cztery typy pamięci agenta

1. Pamięć robocza — okno kontekstu

2. Pamięć epizodyczna — wspomnienia zdarzeń

3. Pamięć semantyczna — wiedza

4. Pamięć proceduralna — umiejętności

Przykład który pokazuje różnicę

Trzy błędy przy projektowaniu pamięci

Narzędzia które warto znać

Co to znaczy dla kogoś kto buduje agenta

Spis treści

Atlas znika po dziewięciu miesiącach — a jego najważniejsza lekcja jest o bezpieczeństwie, nie o rynku

Poza AI Act — czego ta mapa nie obejmuje (a co też jest prawem)

Firma jako podmiot stosujący — AI Act obowiązuje także tych, którzy niczego nie zbudowali

Oznaczanie treści generowanych przez AI — kto, co i od kiedy

Piramida ryzyka — jak AI Act klasyfikuje systemy i gdzie na niej ląduje typowa firma

Chatbot i agent na stronie a obowiązek przejrzystości — termin, który nie został przesunięty

Kalendarz AI Act po Digital Omnibus — co obowiązuje, co wchodzi, co przesunięto

Human-in-the-loop, który kłamie — jak zaprojektować okno zgody, które naprawdę chroni

AI Website Tycoon

Ekonomia widoczności — kto płaci za internet, który czytają maszyny

Agentic Web

Nawigacja

Bądź na bieżąco

Zapisz się na newsletter

Join the Newsletter

Czego szukasz?