2024-2025. Świat Agentic Web budowany był na założeniu że agent AI jest gościem przeglądarki — uruchamiany przez użytkownika, wykonujący konkretne zadanie, kończący sesję. Atlas, Claude in Chrome, Brave Leo. Wszystkie te przeglądarki AI miały wspólny mianownik: użytkownik świadomie decydował się uruchomić agenta.
Maj 2026. Okazało się że Google poszedł inną drogą. Chrome od kilku miesięcy pobiera ~4 GB modelu Gemini Nano na urządzenia użytkowników. Cicho, domyślnie, bez zgody. Sam Chrome staje się tym agentem — nie hostuje go, jest nim.
To jest moment przejścia od jednego paradygmatu do drugiego.
Czym jest Browser-as-Agent
Browser-as-Agent to paradygmat architektoniczny w którym przeglądarka internetowa zawiera wbudowany model językowy (LLM) działający lokalnie na urządzeniu użytkownika i moduluje doświadczenie każdej odwiedzanej strony — przez podsumowywanie, parafrazowanie, klasyfikację i sugestie — bez wyraźnej intencji użytkownika dotyczącej AI i bez wiedzy autora strony, w przeciwieństwie do paradygmatu Agent-in-Browser, w którym agent jest świadomie uruchamianym gościem.
Czym różni się od Agent-in-Browser
Agent-in-Browser to gość: użytkownik klika „uruchom Claude in Chrome”, agent otwiera stronę, wykonuje zadanie, kończy sesję. Strona ma jedno zadanie do obsłużenia. Agent przychodzi z konkretnym celem.
Browser-as-Agent jest cały czas obecny. Nie wchodzi, bo nigdy nie wyszedł. Czyta każdą stronę którą użytkownik otwiera. Moduluje doświadczenie strony zanim użytkownik zacznie scrollować — czasem widocznie (podsumowanie), częściej niewidocznie (kontekst dla innych funkcji AI, parafraza, klasyfikacja kart).
Strona w paradygmacie Browser-as-Agent nigdy nie jest sama z użytkownikiem. Jest zawsze w trójkącie: serwer → lokalny LLM → użytkownik.
Konkretne wcielenie: Gemini Nano w Chrome
W maju 2026 jedynym pełnoskalowym wcieleniem Browser-as-Agent jest Chrome z Gemini Nano. Plik weights.bin (~4 GB) w katalogu OptGuideOnDeviceModel profilu Chrome zawiera wagi modelu który napędza: Help me write (parafraza pól formularzy w kontekście strony), Page summarization (podsumowanie odwiedzanej strony), Tab group suggestions (klasyfikacja otwartych kart) i Smart paste.
Pełna analiza techniczna mechanizmu pobierania, polityki blokowania i implikacji prawnych: CyberFlux: 14 minut 28 sekund zero kliknięć użytkownika.
Implikacje dla agent-readiness
Pod Agent-in-Browser optymalizujesz na zadanie agenta — czy agent wykona poprawnie akcję której się od niego oczekuje. Pod Browser-as-Agent optymalizujesz na reprezentację — czy lokalny LLM potrafi z twojej strony zbudować akceptowalne podsumowanie, klasyfikację i parafrazę.
Techniczna baza jest ta sama (semantyka HTML, schema.org, llms.txt). Kryterium sukcesu różne. Strona która jest agent-ready dla Claude in Chrome jest też lepiej reprezentowana przez Nano. Ale agent-readiness pod Browser-as-Agent wymaga dodatkowo testowania jak lokalny model podsumowuje stronę — nie tylko czy potrafi wykonać akcję.
Skala dystrybucji vs. paradygmat Agent-in-Browser
Wszystkie agentowe przeglądarki Agent-in-Browser razem wzięte — Atlas, Brave Leo, Arc Max, Vivaldi, Comet, Sigma OS — mają w 2026 dziesiątki milionów użytkowników. Browser-as-Agent przez samo Chrome dotyka między 500 milionów a 1 miliarda urządzeń. Dwa rzędy wielkości różnicy.
Z perspektywy projektowania strony to znaczy: Agent-in-Browser to optymalizacja pod niszę aktywnych użytkowników AI, Browser-as-Agent to optymalizacja pod większość internetu.