Pamięć agenta

Mechanizmy przechowywania i odzyskiwania informacji przez agenta AI poza granicami pojedynczej sesji — umożliwiające ciągłość kontekstu i personalizację — przez kombinację pamięci krótkoterminowej (okno kontekstu) i długoterminowej (zewnętrzne bazy wektorowe). Fundament agentów które poprawiają się w czasie.

W Polsce nazywane też:

pamięć agentapamięć długoterminowa AIciągłość kontekstupersonalizacja agenta

Domyślnie model językowy jest amnezyjny. Każde nowe wywołanie zaczyna od zera — bez wiedzy o poprzednich rozmowach, bez pamięci o decyzjach które podjął tydzień temu, bez kontekstu który nabudował przez miesiąc pracy z użytkownikiem. Koniec sesji = koniec pamięci.

Dla prostego chatbota to jest akceptowalne. Dla agenta który ma być użytecznym asystentem przez tygodnie i miesiące — to jest fundamentalne ograniczenie.

Agent memory to zestaw mechanizmów który daje agentom ciągłość przez czas.

Czym jest agent memory

Agent memory to mechanizmy przechowywania i odzyskiwania informacji przez agenta AI poza granicami pojedynczej sesji — umożliwiające ciągłość kontekstu, uczenie się z poprzednich interakcji i personalizację działania na podstawie historii — przez kombinację pamięci krótkoterminowej (okno kontekstu) i długoterminowej (zewnętrzne bazy danych).

Cztery typy pamięci

Pamięć in-context (robocza): informacje które są aktualnie w oknie kontekstu agenta. Natychmiastowy dostęp, brak opóźnienia. Ograniczona rozmiarem kontekstu — znika po zakończeniu sesji. To jest „RAM” agenta.

Pamięć epizodyczna (zewnętrzna, wektorowa): wspomnienia konkretnych interakcji i wydarzeń przechowywane w zewnętrznej bazie wektorowej. Agent może przeszukiwać semantycznie: „co rozmawialiśmy o projekcie X?”, „jaką decyzję podjęliśmy w marcu?”. Trwała między sesjami, przeszukiwalna, ale wymaga dodatkowego retrievalu.

Pamięć semantyczna (wiedza): fakty i wiedza ogólna przechowywana jako baza wiedzy — dokumenty, FAQ, polityki firmy. Agent odpytuje ją przez RAG gdy potrzebuje konkretnej informacji. Różni się od epizodycznej tym że zawiera wiedzę deklaratywną, nie wspomnienia zdarzeń.

Pamięć proceduralna (umiejętności): instrukcje i wzorce działania przechowywane jako prompty lub przykłady few-shot. Agent „uczy się” jak wykonywać określone typy zadań lepiej na podstawie poprzednich doświadczeń.

Pamięć a bezpieczeństwo

Zewnętrzna pamięć długoterminowa jest wektorem ataku. Context poisoning przez bazę wektorową — atakujący wstrzykuje złośliwe „wspomnienie” które agent pobierze przy kolejnym relevantnym zapytaniu. Prywatność danych w pamięci — wspomnienia jednego użytkownika nie powinny być dostępne dla agentów innych użytkowników. Prawo do bycia zapomnianym — GDPR może wymagać możliwości usunięcia danych użytkownika z pamięci agenta.

Implementacje

Mem0, Zep, MemGPT — to są dedykowane systemy pamięci dla agentów. Claude Projects ma wbudowaną pamięć między rozmowami w tym samym projekcie. OpenAI Memory to pamięć między sesjami w ChatGPT. Microsoft Copilot ma pamięć opartą na Azure AI Search i Microsoft Graph — łącząc dane z Outlooka, Teams i SharePointa jako kontekst dla agenta.

Dla enterprise

Enterprise agent z pamięcią jest fundamentalnie innym produktem niż chatbot bez pamięci. Agent który „pamięta” że dany pracownik preferuje podsumowania bullet-pointowe, że projekt X ma deadline w Q3, że klient Y ma specyficzne wymagania formatowania ofert — jest narzędziem które poprawia się w czasie zamiast zaczynać od zera przy każdej interakcji.

Powiązane pojęcia

Zatrucie kontekstuAtak polegający na wprowadzeniu do okna kontekstu agenta — przez zewnętrzne dokumenty, historię konwersacji lub pamięć długoterminową — fałszywych informacji które modyfikują przyszłe zachowanie agenta nawet gdy bezpośredni atak już nie jest aktywny. Szczególnie groźny przy agentach z RAG i pamięcią długoterminową.Praca intencyjnaVibe working to model pracy z agentem AI w którym człowiek określa intencję i oczekiwany efekt, a agent samodzielnie przechodzi przez narzędzia, dane i aplikacje żeby ten efekt dowieźć — bez ręcznej obsługi każdego interfejsu po drodze.Agent AIAutonomiczny system sztucznej inteligencji który samodzielnie planuje i wykonuje złożone zadania — wyszukuje informacje, podejmuje decyzje i działa w imieniu użytkownika bez jego ciągłego nadzoru.Okno kontekstuMaksymalna ilość tekstu (mierzona w tokenach) którą model AI może przetworzyć w jednym zapytaniu — determinuje ile treści strony agent może przeczytać naraz i dlaczego Markdown for Agents ma znaczenie.RAGRetrieval-Augmented Generation — technika wzbogacania odpowiedzi modelu AI o dane pobrane w czasie rzeczywistym ze stron WWW lub baz wiedzy, zamiast polegania wyłącznie na wiedzy z treningu.