Październik 2025. OpenAI ogłasza Atlas — przeglądarkę z natywnym agentem. Anthropic uruchamia Claude in Chrome jako rozszerzenie. Brave dodaje Leo. Każda z tych rzeczy wymaga od użytkownika świadomej decyzji: zainstalować, zalogować się, kliknąć przycisk żeby uruchomić agenta.
To jest paradygmat Agent-in-Browser. Agent jest gościem.
Czym jest Agent-in-Browser
Agent-in-Browser to paradygmat architektoniczny w którym agent AI jest świadomie wywoływanym gościem przeglądarki — uruchamianym przez użytkownika z konkretnym zadaniem (otwórz stronę X, kup produkt Y, zarezerwuj termin Z), działającym przez ograniczony czas i kończącym sesję — w przeciwieństwie do Browser-as-Agent, gdzie LLM jest stale obecny w przeglądarce i moduluje doświadczenie każdej strony automatycznie.
Charakterystyka paradygmatu
Świadoma intencja użytkownika: agent uruchamia się dlatego że użytkownik kliknął przycisk lub wydał polecenie. Bez tego polecenia agent nic nie robi.
Konkretne zadanie: agent ma cel, który użytkownik wyraził. „Zarezerwuj wizytę u dentysty”, „Porównaj ceny tych trzech laptopów”, „Wypełnij formularz kontaktowy”.
Sesyjność: agent działa do momentu wykonania zadania albo do momentu zatrzymania przez użytkownika. Po sesji nie pozostawia „obecności” w przeglądarce.
Widoczność: użytkownik wie że agent działa. Zwykle widzi to: kursor się porusza, formularze się wypełniają, strony się przewijają.
Wcielenia w 2026
Atlas (OpenAI) — natywna przeglądarka z agentem GPT zintegrowanym w pasku narzędzi. Użytkownik wpisuje zadanie, Atlas otwiera potrzebne strony.
Claude in Chrome (Anthropic) — rozszerzenie Chrome które dodaje Claude’a jako agenta sterującego przeglądarką. Użytkownik prosi Claude’a o zadanie, Claude wykonuje kliknięcia i wypełnia formularze.
Brave Leo, Arc Max, Comet, Sigma OS — wszystkie te przeglądarki AI implementują Agent-in-Browser w różnych odmianach.
Implikacje dla agent-readiness
Pod Agent-in-Browser strona optymalizuje się na zadanie agenta. Kryterium sukcesu: czy agent wykona poprawnie akcję której się od niego oczekuje. Strona musi mieć:
Czystą semantykę HTML (agent musi zrozumieć strukturę), schema.org (agent musi zrozumieć typy treści — produkty, usługi, lokalizacje), llms.txt (agent musi szybko zorientować się czego szuka), accessible formularze (agent musi umieć je wypełnić), stabilne selektory (akcje agenta muszą być powtarzalne między wizytami).
Eksperyment Salon kosmetyczny vs Claude in Chrome pokazał: strona agent-ready osiąga 40-60% lepszą skuteczność wykonania zadań agenta niż identyczna wizualnie strona bez agent-readiness.
Relacja do Browser-as-Agent
Agent-in-Browser i Browser-as-Agent nie są wykluczające — w 2026 użytkownik Chrome ma równocześnie obecny lokalny Gemini Nano (Browser-as-Agent) i może zainstalować Claude in Chrome jako rozszerzenie (Agent-in-Browser). Te dwie warstwy działają na różnych poziomach.
Z perspektywy autora strony: techniczna baza agent-readiness jest wspólna. Różnica w testowaniu — pod Agent-in-Browser testujesz wykonanie zadań, pod Browser-as-Agent testujesz reprezentację (jak model opisuje twoją stronę).