Agent który działa na laptopie developera jest prototypem. Agent który obsługuje tysiące użytkowników dziennie, z SLA 99.9% uptime, z monitoringiem, rollback w przypadku błędów i automatycznym skalowaniem — to jest agent w produkcji.
Droga od prototypu do produkcji jest dłuższa dla agentów niż dla tradycyjnego software — bo agenty mają dodatkowe wymiary: model versioning, prompt versioning, ewaluacja przed deployment, i nieodwracalne akcje które wymagają szczególnej ostrożności przy aktualizacjach.
Czym jest agent deployment
Agent deployment to proces wdrażania agenta AI do środowiska produkcyjnego — obejmujący containeryzację, konfigurację infrastruktury, CI/CD pipeline z ewaluacją jakości jako bramką przed wdrożeniem, strategię rollout (canary, blue-green) i monitoring po wdrożeniu — z dodatkowymi wyzwaniami specyficznymi dla AI: prompt versioning, model versioning i zarządzaniem niedeterministycznym zachowaniem.
Containeryzacja agentów
Docker jako standard — agent i wszystkie jego zależności (model API client, vector database client, tool implementations) są pakowane w kontener. Kubernetes do orchestracji i skalowania.
Specyfika AI: model weights przy self-hosted deployment mogą zajmować dziesiątki GB — images są duże. Layer caching i dedykowane image repositories dla modeli (Hugging Face, private registry) są praktykami które redukują czas deployu.
CI/CD pipeline z ewaluacją
Tradycyjny CI/CD: commit → testy jednostkowe → testy integracyjne → deployment. Agent CI/CD dodaje: ewaluacja na zbiorze testowym → benchmark jakości → deployment jeśli jakość nie zmalała.
Regresja jakości agenta może być subtelna — zmiana system promptu która poprawia jeden aspekt może pogorszyć inny. Automatyczna ewaluacja przed deployment jest bramką która to wychwytuje.
Canary deployment dla agentów
Canary deployment: najpierw 1-5% ruchu idzie do nowej wersji, reszta do starej. Monitoring anomalii: czy nowa wersja ma wyższy error rate, wyższe koszty tokenów, niższe oceny użytkowników? Jeśli metryki są dobre — stopniowe przesuwanie ruchu do nowej wersji. Jeśli nie — rollback.
Szczególnie ważne dla agentów z nieodwracalnymi akcjami (zakupy, transakcje, wysyłanie maili) — nowa wersja powinna być przetestowana przy minimalnym ruchu zanim dostanie pełny wolumen.
Prompt versioning
System prompt to kod — powinien być wersjonowany jak kod. Git dla system promptów, changelog przy każdej zmianie, możliwość rollback do poprzedniej wersji. LangSmith i podobne narzędzia mają wbudowane zarządzanie wersjami promptów z możliwością A/B testowania.