Software engineering ma obserwability jako fundament produkcji: logi, metryki, trace. Gdy coś się psuje, wiesz gdzie szukać. Debugger, log aggregator, APM — narzędzia które sprawiają że system jest zrozumiały w czasie rzeczywistym.
Agent AI w produkcji wymaga tego samego — ale standardowe narzędzia APM nie rozumieją konceptów agentowych: tool calls, reasoning steps, retrieval, token consumption. Potrzeba nowej warstwy obserwability.
Czym jest agent observability
Agent observability to praktyka monitorowania działania agentów AI w środowisku produkcyjnym — przez strukturalne logowanie każdego kroku agent loop (wiadomości, tool calls, retrievals, reasoning), metryki wydajności (latency, token cost, error rate, tool call success rate) i narzędzia do debugowania konkretnych konwersacji — pozwalająca wykrywać anomalie, optymalizować koszty i diagnozować błędy.
Trzy poziomy observability
Tracing: pełen zapis każdej konwersacji z rozpisanymi krokami. „Wiadomość użytkownika → reasoning → tool call X → wynik → reasoning → odpowiedź.” LangSmith, Weights & Biases Weave, Arize AI — dedykowane narzędzia do tracingu agentów.
Metryki: agregowane liczby które pokazują zdrowie systemu. Latency p50/p95/p99, token cost per conversation, tool call success rate, error rate, conversation length distribution. Dashboard który IT monitoruje.
Alerts: automatyczne powiadomienia gdy metryki przekraczają progi. Latency > 10s, error rate > 5%, nieoczekiwany wzrost token cost — sygnały że coś wymaga uwagi.
Token cost observability
Koszty tokenów w produkcji są często zaskakujące. Agent który w testach kosztował $0.05 per conversation może kosztować $0.50 w produkcji gdy użytkownicy prowadzą długie konwersacje lub agent wchodzi w pętle. Monitoring token cost per conversation (nie tylko per call) jest kluczowy dla kontroli kosztów.
Narzędzia 2026
LangSmith (LangChain): tracing, ewaluacja, prompt management. Jedna platforma dla całego lifecycle agenta. OpenTelemetry dla agentów AI: emergujący standard dla strukturalnego tracingu. Anthropic Console: wbudowany tracing dla Claude-based agentów. Azure Monitor: dla agentów na Azure AI Foundry — integracja z istniejącą observability infrastrukturą enterprise.
Observability a security
Logi obserwability mogą zawierać wrażliwe dane — treść konwersacji użytkownika, dane pobrane przez retrieval, parametry tool calls. Konfiguracja redakcji wrażliwych danych w logach (PII scrubbing) jest obowiązkowa dla systemów przetwarzających dane osobowe. Logi z niezredagowanymi danymi osobowymi to problem GDPR.