Auto Browse w Chrome

Feature Chrome wbudowany w Gemini in Chrome — pozwala Gemini wykonywać "digital chores" w imieniu użytkownika autonomicznie. Już dostępny na desktopie, od końca czerwca 2026 na Android. Materializacja paradygmatu Browser-as-Agent. Działa w bieżącej sesji przeglądarki z dostępem do logowanych kont.

W Polsce nazywane też:

Auto BrowseAuto Browse Chromeautomatyczne przeglądanie Chrome

Browser-as-Agent w marcu 2026 był paradygmatem opisanym na webflux.pl. W maju 2026 stał się produktem o nazwie Auto Browse — wbudowanym w domyślnego Chrome’a, najpierw na desktopie, od końca czerwca na mobile. Paradygmat się zmaterializował.

Czym jest Auto Browse

Auto Browse to feature Chrome’a wbudowany w Gemini in Chrome — pozwalający Gemini’emu wykonywać „digital chores” w imieniu użytkownika autonomicznie — od końca czerwca 2026 dostępny na Android (z planowanymi rozszerzeniami). Już dostępny na desktopie. Praktyczne przykłady: znalezienie parkingu przed wydarzeniem, sprawdzenie dostępności produktu, rezerwacja stolika, wypełnienie formularza. Agent działa w bieżącej sesji przeglądarki, z dostępem do logowanych kont i zapisanych danych.

Jak działa

Aktywacja: użytkownik mówi do Gemini w Chrome „znajdź mi parking blisko teatru na 19:00” lub klika sugerowane akcje. Gemini:
1. Analizuje intencję,
2. Otwiera nowy tab z odpowiednią stroną (np. Park.pl, BookMyPark, lokalny parking),
3. Wypełnia search formularz (lokalizacja, czas, długość parkowania),
4. Wykonuje search,
5. Analizuje wyniki,
6. Wybiera optimum (najbliżej, najtaniej, najlepsza ocena),
7. Przechodzi do rezerwacji (jeśli zalogowany),
8. Prosi użytkownika o potwierdzenie ostatniego kroku (płatność).

Cały proces: kilkanaście do kilkudziesięciu sekund. Bez Auto Browse byłoby 3-5 minut manualnego klikania.

Dla webmasterów: co Auto Browse zmienia

Auto Browse to materializacja paradygmatu Browser-as-Agent. Co to znaczy dla strony:

**Po pierwsze: agent będzie pełnoprawnym ruchem na stronie**. Każda strona, która oferuje booking, rezerwację, sprawdzanie dostępności, formularze — będzie odwiedzana przez Auto Browse w imieniu użytkownika.

**Po drugie: strony agent-friendly wygrywają**. Strona z dobrą hierarchią semantyczną (article, nav, main), formularzami z label, structured data dla Service / Product / Event — pozwala Auto Browse szybciej i pewniej wykonać zadanie. Strona oporna na agentów (skomplikowane JavaScript wizard’y, CAPTCHA na każdym kroku, brak schema.org) zostanie pominięta przez Auto Browse, który wybierze konkurenta.

**Po trzecie: liczy się też przewidywalność**. Auto Browse zostanie wytrenowany na pewnych wzorach układu strony. Strony łamiące te wzory (każdy ekran inny, każda akcja w innym miejscu) frustrują agenta.

Bezpieczeństwo i scope

Auto Browse działa w sesji przeglądarki użytkownika. To znaczy:
– ma dostęp do logowanych kont (Gmail, e-commerce, bank — jeśli zalogowany),
– ma dostęp do zapisanych haseł i danych płatniczych (autofill),
– może wykonywać akcje finansowe (płatność za parking),
– może wprowadzać zmiany w kontach użytkownika.

To otwiera kategorię ryzyka, której Browser-as-Agent dotychczas nie miał w sposób tak konkretny. Tematem osobnego wpisu (flagowy CyberFlux) w hubie Google I/O 2026.

Roadmap

– **Już dostępne**: desktopowa wersja Chrome,
– **Od końca czerwca 2026**: Android (urządzenia z 4GB+ RAM, języka US-English na start),
– **Później 2026**: integracja z Gemini Spark dla 24/7 background agenta.

Gemini 3.5 FlashFlagowy model językowy ogłoszony na Google I/O 2026 (19 maja), GA 21 maja. Czterokrotnie szybszy niż dotychczasowe frontier modele, zoptymalizowany pod agentic coding, long-horizon tasks i real-world workflows. Silnik Antigravity 2.0, Auto Browse, Gemini Spark.Gemini SparkPersistent AI agent ogłoszony przez Google na I/O 2026 — działający w tle 24/7 jako "personal AI", monitorujący kontekst użytkownika (kalendarz, mail, taby, lokalizacja) i podejmujący proaktywne akcje. Dostępny dla subskrybentów Google AI Ultra. Pierwsza praktyczna implementacja paradygmatu always-on agent w mainstream produkcie konsumenckim.Nano BananaOn-device image generation w Chrome Google'a — feature wykorzystujący lokalny model (Gemini Nano lub Gemma 197M) do generowania i edycji obrazów bezpośrednio w przeglądarce, bez API zewnętrznego. Premiera Android: koniec czerwca 2026. "Nano Banana moment" jako branżowy termin dla momentu demokratyzacji danej kategorii generative AI on-device.Skills w ChromeFeature Chrome ogłoszony na I/O 2026 pozwalający użytkownikowi zapisywać złożone prompty do Gemini jako "skills" — wielokrotnie używalne, jedno-klikowe narzędzia z parametrami. Sprowadza AI z modelu "request/response chat" na model "narzędzia, których używasz wielokrotnie".Przeglądarka-jako-AgentParadygmat w którym przeglądarka zawiera wbudowany lokalny LLM modulujący doświadczenie każdej odwiedzanej strony — bez wyraźnej intencji użytkownika i bez wiedzy autora strony. W przeciwieństwie do Agent-in-Browser (świadomie uruchamiany gość), Browser-as-Agent jest cały czas obecny. Wcielenie: Chrome z Gemini Nano w 500M+ urządzeń.Pierwszy CzytelnikModel AI który czyta twoją stronę przed człowiekiem — bezpośrednio (Page Summarization, Help me write) lub pośrednio (crawl przez ChatGPT/Perplexity/Claude) — i decyduje co człowiek z twojej strony zobaczy, kiedy zobaczy ją bezpośrednio, oraz w jakim kontekście. Termin spopularyzowany przez WebFlux.pl w analizie konsekwencji Browser-as-Agent dla web designu.WebMCPPropozycja standardu Google pozwalająca stronom internetowym wystawiać agentom zestaw akcji które mogą wykonać bezpośrednio — bez konieczności zgadywania struktury DOM przez agenta.Gotowość agentowaZestaw cech strony internetowej decydujący o tym, czy agent AI potrafi ją skutecznie odczytać, zrozumieć i wykonać na niej działanie w imieniu użytkownika.