Domyślnie model językowy jest amnezyjny. Każde nowe wywołanie zaczyna od zera — bez wiedzy o poprzednich rozmowach, bez pamięci o decyzjach które podjął tydzień temu, bez kontekstu który nabudował przez miesiąc pracy z użytkownikiem. Koniec sesji = koniec pamięci.
Dla prostego chatbota to jest akceptowalne. Dla agenta który ma być użytecznym asystentem przez tygodnie i miesiące — to jest fundamentalne ograniczenie.
Agent memory to zestaw mechanizmów który daje agentom ciągłość przez czas.
Czym jest agent memory
Agent memory to mechanizmy przechowywania i odzyskiwania informacji przez agenta AI poza granicami pojedynczej sesji — umożliwiające ciągłość kontekstu, uczenie się z poprzednich interakcji i personalizację działania na podstawie historii — przez kombinację pamięci krótkoterminowej (okno kontekstu) i długoterminowej (zewnętrzne bazy danych).
Cztery typy pamięci
Pamięć in-context (robocza): informacje które są aktualnie w oknie kontekstu agenta. Natychmiastowy dostęp, brak opóźnienia. Ograniczona rozmiarem kontekstu — znika po zakończeniu sesji. To jest „RAM” agenta.
Pamięć epizodyczna (zewnętrzna, wektorowa): wspomnienia konkretnych interakcji i wydarzeń przechowywane w zewnętrznej bazie wektorowej. Agent może przeszukiwać semantycznie: „co rozmawialiśmy o projekcie X?”, „jaką decyzję podjęliśmy w marcu?”. Trwała między sesjami, przeszukiwalna, ale wymaga dodatkowego retrievalu.
Pamięć semantyczna (wiedza): fakty i wiedza ogólna przechowywana jako baza wiedzy — dokumenty, FAQ, polityki firmy. Agent odpytuje ją przez RAG gdy potrzebuje konkretnej informacji. Różni się od epizodycznej tym że zawiera wiedzę deklaratywną, nie wspomnienia zdarzeń.
Pamięć proceduralna (umiejętności): instrukcje i wzorce działania przechowywane jako prompty lub przykłady few-shot. Agent „uczy się” jak wykonywać określone typy zadań lepiej na podstawie poprzednich doświadczeń.
Pamięć a bezpieczeństwo
Zewnętrzna pamięć długoterminowa jest wektorem ataku. Context poisoning przez bazę wektorową — atakujący wstrzykuje złośliwe „wspomnienie” które agent pobierze przy kolejnym relevantnym zapytaniu. Prywatność danych w pamięci — wspomnienia jednego użytkownika nie powinny być dostępne dla agentów innych użytkowników. Prawo do bycia zapomnianym — GDPR może wymagać możliwości usunięcia danych użytkownika z pamięci agenta.
Implementacje
Mem0, Zep, MemGPT — to są dedykowane systemy pamięci dla agentów. Claude Projects ma wbudowaną pamięć między rozmowami w tym samym projekcie. OpenAI Memory to pamięć między sesjami w ChatGPT. Microsoft Copilot ma pamięć opartą na Azure AI Search i Microsoft Graph — łącząc dane z Outlooka, Teams i SharePointa jako kontekst dla agenta.
Dla enterprise
Enterprise agent z pamięcią jest fundamentalnie innym produktem niż chatbot bez pamięci. Agent który „pamięta” że dany pracownik preferuje podsumowania bullet-pointowe, że projekt X ma deadline w Q3, że klient Y ma specyficzne wymagania formatowania ofert — jest narzędziem które poprawia się w czasie zamiast zaczynać od zera przy każdej interakcji.