Przeglądarka-jako-Agent

Paradygmat w którym przeglądarka zawiera wbudowany lokalny LLM modulujący doświadczenie każdej odwiedzanej strony — bez wyraźnej intencji użytkownika i bez wiedzy autora strony. W przeciwieństwie do Agent-in-Browser (świadomie uruchamiany gość), Browser-as-Agent jest cały czas obecny. Wcielenie: Chrome z Gemini Nano w 500M+ urządzeń.

W Polsce nazywane też:

Browser-as-Agentprzeglądarka jako agentprzeglądarka z lokalnym LLMparadygmat Browser-as-Agent

2024-2025. Świat Agentic Web budowany był na założeniu że agent AI jest gościem przeglądarki — uruchamiany przez użytkownika, wykonujący konkretne zadanie, kończący sesję. Atlas, Claude in Chrome, Brave Leo. Wszystkie te przeglądarki AI miały wspólny mianownik: użytkownik świadomie decydował się uruchomić agenta.

Maj 2026. Okazało się że Google poszedł inną drogą. Chrome od kilku miesięcy pobiera ~4 GB modelu Gemini Nano na urządzenia użytkowników. Cicho, domyślnie, bez zgody. Sam Chrome staje się tym agentem — nie hostuje go, jest nim.

To jest moment przejścia od jednego paradygmatu do drugiego.

Czym jest Browser-as-Agent

Browser-as-Agent to paradygmat architektoniczny w którym przeglądarka internetowa zawiera wbudowany model językowy (LLM) działający lokalnie na urządzeniu użytkownika i moduluje doświadczenie każdej odwiedzanej strony — przez podsumowywanie, parafrazowanie, klasyfikację i sugestie — bez wyraźnej intencji użytkownika dotyczącej AI i bez wiedzy autora strony, w przeciwieństwie do paradygmatu Agent-in-Browser, w którym agent jest świadomie uruchamianym gościem.

Czym różni się od Agent-in-Browser

Agent-in-Browser to gość: użytkownik klika „uruchom Claude in Chrome”, agent otwiera stronę, wykonuje zadanie, kończy sesję. Strona ma jedno zadanie do obsłużenia. Agent przychodzi z konkretnym celem.

Browser-as-Agent jest cały czas obecny. Nie wchodzi, bo nigdy nie wyszedł. Czyta każdą stronę którą użytkownik otwiera. Moduluje doświadczenie strony zanim użytkownik zacznie scrollować — czasem widocznie (podsumowanie), częściej niewidocznie (kontekst dla innych funkcji AI, parafraza, klasyfikacja kart).

Strona w paradygmacie Browser-as-Agent nigdy nie jest sama z użytkownikiem. Jest zawsze w trójkącie: serwer → lokalny LLM → użytkownik.

Konkretne wcielenie: Gemini Nano w Chrome

W maju 2026 jedynym pełnoskalowym wcieleniem Browser-as-Agent jest Chrome z Gemini Nano. Plik weights.bin (~4 GB) w katalogu OptGuideOnDeviceModel profilu Chrome zawiera wagi modelu który napędza: Help me write (parafraza pól formularzy w kontekście strony), Page summarization (podsumowanie odwiedzanej strony), Tab group suggestions (klasyfikacja otwartych kart) i Smart paste.

Pełna analiza techniczna mechanizmu pobierania, polityki blokowania i implikacji prawnych: CyberFlux: 14 minut 28 sekund zero kliknięć użytkownika.

Implikacje dla agent-readiness

Pod Agent-in-Browser optymalizujesz na zadanie agenta — czy agent wykona poprawnie akcję której się od niego oczekuje. Pod Browser-as-Agent optymalizujesz na reprezentację — czy lokalny LLM potrafi z twojej strony zbudować akceptowalne podsumowanie, klasyfikację i parafrazę.

Techniczna baza jest ta sama (semantyka HTML, schema.org, llms.txt). Kryterium sukcesu różne. Strona która jest agent-ready dla Claude in Chrome jest też lepiej reprezentowana przez Nano. Ale agent-readiness pod Browser-as-Agent wymaga dodatkowo testowania jak lokalny model podsumowuje stronę — nie tylko czy potrafi wykonać akcję.

Skala dystrybucji vs. paradygmat Agent-in-Browser

Wszystkie agentowe przeglądarki Agent-in-Browser razem wzięte — Atlas, Brave Leo, Arc Max, Vivaldi, Comet, Sigma OS — mają w 2026 dziesiątki milionów użytkowników. Browser-as-Agent przez samo Chrome dotyka między 500 milionów a 1 miliarda urządzeń. Dwa rzędy wielkości różnicy.

Z perspektywy projektowania strony to znaczy: Agent-in-Browser to optymalizacja pod niszę aktywnych użytkowników AI, Browser-as-Agent to optymalizacja pod większość internetu.

Powiązane pojęcia

Agent w PrzeglądarceParadygmat w którym agent AI jest świadomie wywoływanym gościem przeglądarki — uruchamianym przez użytkownika z konkretnym zadaniem, działającym sesyjnie. Wcielenia: Atlas (OpenAI), Claude in Chrome, Brave Leo. Przeciwwaga dla Browser-as-Agent.Przeramowanie treści po stronie przeglądarkiZjawisko w którym treść strony WWW jest modyfikowana, podsumowywana, klasyfikowana lub parafrazowana przez lokalny model AI w przeglądarce użytkownika ZANIM zostanie zaprezentowana w finalnej formie — bez wiedzy autora strony. Łamie historyczny kontrakt "serwer wysyła HTML, przeglądarka renderuje". Niewidoczne dla klasycznych analytics.Gemini NanoLokalny LLM od Google z rodziny Gemini, przeznaczony do uruchomienia na urządzeniu użytkownika — napędzający funkcje AI w Chrome (Help me write, Page summarization, Tab group suggestions). Jedyne pełnoskalowe wcielenie Browser-as-Agent w 2026 — pre-stage'owany na ~500M+ urządzeń desktop bez zgody użytkownika.Pomóż mi napisać (Chrome)Funkcja Chrome wykorzystująca lokalny Gemini Nano do pomocy użytkownikowi w pisaniu treści w polach formularzy — z menu kontekstowego prawego kliknięcia. Model czyta kontekst strony (nagłówki, opis, FAQ) i generuje treść w stylu witryny. Wiadomości od klientów stają się generowane przez model, nie przez klienta.Katalog modelu na urządzeniu (Chrome)Nazwa katalogu w profilu Chrome zawierającego wagi Gemini Nano (~4 GB w weights.bin) — wewnętrzny skrót od "Optimization Guide On Device Model" wybrany zamiast nazwy "GeminiNano", co utrudnia użytkownikowi powiązanie artefaktu z marką i kategorią produktu. Przykład scope inflation through generic naming.Podsumowywanie strony (Chrome)Funkcja Chrome wykorzystująca Gemini Nano do generowania 5-7 zdań podsumowania aktualnie otwartej strony — z menu kontekstowego, paska narzędzi i side panel'u. Podsumowanie staje się "twoją stroną" w głowie użytkownika. Jakość zależy od semantyki HTML, schema.org, hierarchii nagłówków i llms.txt.Ciche wdrożenie AI po stronie klientaWzorzec dystrybucji w którym vendor automatycznie umieszcza komponenty AI (modele, mosty, runtime'y) na urządzeniu użytkownika bez zgody, z automatycznym przywracaniem po usunięciu — wykorzystując kanały aktualizacji jako warstwę dostarczenia AI. Wcielenia: Chrome z Gemini Nano (4 GB), Anthropic Claude Desktop z Native Messaging bridge.Gotowość agentowaZestaw cech strony internetowej decydujący o tym, czy agent AI potrafi ją skutecznie odczytać, zrozumieć i wykonać na niej działanie w imieniu użytkownika.