Na początku 2025 przeglądarka AI to był jeden produkt — Operator od OpenAI, dostępny dla wybranych użytkowników w USA. W maju 2026 — i szczególnie po Google I/O 2026 z 9 maja — jest ich co najmniej siedem od pięciu różnych firm, każda z własną architekturą, każda inaczej widząca stronę internetową.
To ma znaczenie dla każdego kto buduje strony — bo agent który odwiedza Twoją stronę w imieniu klienta może być jednym z tych siedmiu. I każdy z nich robi to trochę inaczej.
Update po I/O 2026: dodaliśmy Chrome z Auto Browse jako osobną kategorię — feature wbudowany w przeglądarkę której używa około trzech miliardów ludzi globalnie. To zmienia skalę całej dyskusji, bo nie wymaga instalacji nowej aplikacji. Rozszerzyliśmy też podsumowanie o refleksję nad tym co przyjście Chrome do agentic browsing oznacza dla właścicieli stron.
Poniżej przegląd bez gwiazdek i rankingów. Każda przeglądarka dostaje opis czym jest, jak działa i co z niej wynika dla właściciela strony.
ChatGPT Atlas — OpenAI
Czym jest: Dedykowana przeglądarka od OpenAI z ChatGPT wbudowanym w każdą kartę. Agent Mode pozwala ChatGPT samodzielnie otwierać karty, klikać i wykonywać zadania wieloetapowe.
Architektura: Model CUA (Computer-Using Agent) oparty na GPT widzi stronę jako piksele i działa przez wirtualną myszkę i klawiaturę — tak jak człowiek. Nie wymaga specjalnych API od właściciela strony.
Dostępność: macOS, dla użytkowników Plus, Pro i Business. Dostępna pod adresem chatgpt.com/atlas.
Ograniczenia świadome: nie pobiera plików, nie uruchamia kodu, nie ma dostępu do systemu plików. Na stronach finansowych zatrzymuje się i czeka na potwierdzenie.
Co oznacza dla Twojej strony: Atlas widzi wyrenderowaną stronę — JavaScript wykonany, treść załadowana. Etykiety tekstowe mają znaczenie bardziej niż struktura kodu. Partnerstwa z DoorDash, Instacart, OpenTable, Uber — na tych serwisach agent działa sprawniej niż na stronach bez integracji.
Szczegółowy opis: ChatGPT Atlas — opis narzędzia
Claude in Chrome — Anthropic
Czym jest: Rozszerzenie Chrome które zamienia Clauda w agenta przeglądarkowego działającego w Twojej przeglądarce, na Twoim profilu, z Twoją historią i ciasteczkami.
Architektura: Rozszerzenie — nie osobna przeglądarka. Claude widzi wyrenderowaną stronę łącznie z JavaScriptem, wchodzi do iframe, klika przyciski onclick. Działa w panelu bocznym obok strony.
Dostępność: Chrome, konto Claude.ai (wszystkie plany).
Co oznacza dla Twojej strony: Najlepsze narzędzie do testowania agent-readiness własnej strony — jest dostępne, darmowe dla użytkowników Claude i pokazuje dokładnie co agent widzi i robi. Claude Sonnet 4.6 osiąga 72,5% na benchmarku OSWorld — najwyższy wynik wśród przeglądarek agentowych.
Szczegółowy opis: Claude in Chrome — opis narzędzia
Opera Neon — Opera
Czym jest: Dedykowana przeglądarka agentowa od Opera — osobny produkt obok Opera One i Opera GX, skierowany do power users pracujących z AI intensywnie.
Architektura: Dwa podejścia naraz. Browser Operator działa natywnie po stronie klienta — nie robi screenshotów, nie używa chmury, przetwarza stronę bezpośrednio w strukturze przeglądarki. Zachowuje dane użytkownika lokalnie. W marcu 2026 Opera dodała MCP Connector — zewnętrzne agenty AI (Claude, ChatGPT, n8n, OpenClaw) mogą podłączyć się bezpośrednio do przeglądarki i działać w aktywnej sesji użytkownika.
Dostępność: Desktop (macOS, Windows), subskrypcja premium. Opera One i GX mają bezpłatne AI (Aria) z Gemini i GPT — bez pełnego trybu agentowego.
Co oznacza dla Twojej strony: MCP Connector to ciekawy kierunek — jeśli Twoja strona implementuje MCP, agent w Opera Neon może korzystać z gotowych kontraktów akcji zamiast zgadywać interfejs. Architektura natywna (bez screenshotów) może inaczej interpretować strukturę strony niż modele wizyjne.
Perplexity Comet — Perplexity
Czym jest: Przeglądarka od Perplexity z agentem AI wbudowanym jako domyślny interfejs. Dostępna na macOS, Windows, iOS i Android — jako jedyna ma pełny rollout cross-platform.
Architektura: Dedykowana przeglądarka agentowa (Chromium-based). Agent działa w tym samym środowisku co użytkownik — bez wirtualnych maszyn, bez chmury. Od marca 2026 Comet Agent używa modelu Claude Sonnet 4.6 domyślnie (Opus 4.6 dla użytkowników Max).
Dostępność: Bezpłatna do pobrania, Perplexity Pro i Max dla zaawansowanych funkcji. Najszersza dostępność spośród wszystkich przeglądarek agentowych.
Co oznacza dla Twojej strony: Comet to jedyna przeglądarka agentowa dostępna na wszystkich platformach — desktop i mobile. To znaczy że agent który odwiedza Twoją stronę może działać na telefonie klienta. Responsywność i czytelność na mobile nie jest już tylko kwestią UX — jest kwestią agent-readiness.
Microsoft Copilot Mode — Microsoft
Czym jest: Tryb agentowy wbudowany bezpośrednio w Edge. Nie osobna przeglądarka — rozszerzenie możliwości Copilota o agentowe działanie w aktywnym oknie przeglądarki.
Architektura: Oparty na modelu CUA od OpenAI (ta sama technologia co Atlas). Dostępny dla użytkowników enterprise przez Copilot Studio — tam można budować własnych agentów z dostępem do przeglądarki.
Dostępność: Edge dla konsumentów, Copilot Studio dla enterprise. Setki milionów urządzeń Windows mają Edge domyślnie — to największa potencjalna baza użytkowników wśród przeglądarek opartych o Edge.
Co oznacza dla Twojej strony: Jeśli Twoja firma sprzedaje do enterprise lub korporacji — Copilot Mode jest prawdopodobnie agentem który już teraz przegląda Twoją stronę cennikową. Microsoft notuje że Copilot mocno preferuje strony ze schema.org markup i natywne elementy HTML w formularzach.
Chrome z Auto Browse — Google
Czym jest: Auto Browse to natywny tryb agentowy wbudowany w Chrome jako przeglądarkę, ogłoszony na Google I/O 2026. Nie rozszerzenie, nie osobna aplikacja, nie inny produkt — sama przeglądarka której używa około trzech miliardów ludzi otrzymuje zdolność wykonywania zadań wieloetapowych w imieniu użytkownika. Już dostępny na desktopie, od końca czerwca 2026 na Android. Równolegle z Auto Browse Chrome zyskuje Skills in Chrome — feature pozwalający zapisywać złożone prompty jako wielokrotnie używalne narzędzia jednoklikowe, kategoryzowane i sparametryzowane.
Architektura: Auto Browse działa w aktywnej sesji użytkownika — na jego profilu, z jego zalogowanymi kontami, w jego oknie przeglądarki. Silnikiem jest Gemini 3.5 Flash, flagowy model Google z I/O 2026 — czterokrotnie szybszy niż dotychczasowe frontier modele, zoptymalizowany pod long-horizon tasks i real-world workflows. Agent widzi wyrenderowaną stronę, DOM, semantyczne struktury i dostępne dane Schema.org. Architektura zakłada scoped permissions — agent ma dostęp tylko do tych kart i akcji które użytkownik zaakceptował, plus sandbox dla wrażliwych operacji (płatności, autoryzacje, dane finansowe). Przed krytycznymi akcjami Chrome zatrzymuje agenta i prosi o explicit confirmation.
Dostępność: Rollout w fazach od Chrome Stable, początkowo dla zalogowanych użytkowników Google z włączonymi Smart Features. Desktop najpierw, Android od końca czerwca 2026. Bez subskrypcji premium — Auto Browse jest częścią Chrome.
Co oznacza dla Twojej strony: Zmiana skali jest fundamentalna. Atlas, Comet, Opera Neon, Edge Copilot, Claude in Chrome — każdy ma swoich użytkowników, ale razem to dziesiątki milionów. Chrome z Auto Browse to potencjalnie miliardy. Drugie ważne — Chrome zna profil użytkownika Google: historię wyszukiwania, Gmail (jeśli włączony), Calendar, Maps. Auto Browse może działać z kontekstem którego inne agenty nie mają. Trzecie — Gemini 3.5 Flash, według sygnałów z keynote'u I/O 2026, mocno preferuje strony z prawidłowo zaimplementowaną Schema.org, semantycznymi formularzami i czytelnymi etykietami akcji. Strony bez tych elementów będą obsługiwane gorzej. Czwarte — Skills in Chrome zmienia dynamikę cytowania: jeśli użytkownik zapisze Skill „streść tę stronę" — Twoja strona może zostać przeparsowana i zacytowana, ale czytelnik nigdy nie zobaczy jej bezpośrednio. Citation readiness staje się ważniejsza niż klasyczne metryki engagement.
Szczegółowy opis: Auto Browse + Gemini Spark — kiedy Browser-as-Agent przestaje być paradygmatem
Gemini Agent — Google
Czym jest: Gemini Agent to następca Project Marinera — Google wygasiło prototyp badawczy i wciągnęło możliwości agentowe bezpośrednio do Gemini. Ten sam wzorzec co OpenAI: osobny produkt badawczy (Mariner / Operator) zastąpiony przez tryb agentowy w głównej aplikacji.
Architektura: Gemini 3.1 Pro jako model bazowy, live web browsing, integracja z Google Apps (Gmail, Calendar, Drive, Maps, YouTube). Agent planuje zadanie, kombinuje przeglądanie sieci z dostępem do ekosystemu Google i wykonuje wieloetapowe zadania. Przed krytycznymi akcjami (wysłanie maila, zakup) czeka na potwierdzenie użytkownika.
Dostępność: Google AI Ultra w USA, język angielski, użytkownicy 18+. Brak dostępu dla kont Workspace i studenckich. Dostępny pod adresem gemini.google.com/agent — rollout trwa.
Co oznacza dla Twojej strony: Gemini Agent wie o użytkowniku więcej niż jakikolwiek inny agent — Gmail, Calendar, Drive, historia wyszukiwania. Jeśli ktoś szukał Twojej kategorii produktów w Google, a potem wyśle agenta żeby dokończył zadanie — Gemini ma pełen kontekst tej intencji. User agent Google-Agent w logach serwera (wprowadzony przy Marinerze) pozostaje — warto śledzić.
Uwaga — Gemini Agent to nie Auto Browse w Chrome. Gemini Agent to wyspecjalizowany consumer product dla zaawansowanych zadań w aplikacji Gemini, z ograniczonym rolloutem (USA, AI Ultra, język angielski). Auto Browse (opisany powyżej) jest natywnym agentem w samej przeglądarce Chrome, z masową dostępnością bez subskrypcji premium. Oba produkty są od Google, ale różnią się skalą, modelami bazowymi (Gemini 3.1 Pro vs Gemini 3.5 Flash) i kontekstem operacyjnym.
Trzeci produkt Google z I/O 2026 — Gemini Spark. Warto wspomnieć dla pełnego obrazu, choć wykracza poza zakres tego przeglądu przeglądarek. Gemini Spark to persistent AI agent działający w tle 24/7 — monitoruje kontekst użytkownika (kalendarz, mail, taby, lokalizacja) i podejmuje proaktywne akcje. To pierwsza praktyczna implementacja paradygmatu always-on agent w mainstream produkcie konsumenckim. Dostępny dla subskrybentów Google AI Ultra. Spark, Auto Browse i Gemini Agent dzielą wspólny silnik (Gemini 3.5 Flash w przypadku Spark i Auto Browse) ale realizują trzy różne modele interakcji: proaktywny ciągły (Spark), reaktywny w przeglądarce (Auto Browse), reaktywny w dedykowanej aplikacji (Gemini Agent).
Jak to czytać z perspektywy właściciela strony
Kilka obserwacji które wynikają z zestawienia tych siedmiu:
Różne architektury, ten sam efekt końcowy. Atlas i Copilot widzą stronę przez piksele. Opera Neon przetwarza strukturę natywnie. Claude in Chrome wykonuje JavaScript i wchodzi w DOM. Chrome z Auto Browse łączy renderowanie z dostępem do DOM i Schema.org. Każdy inaczej — ale każdy widzi wyrenderowaną stronę, nie surowy HTML. Crawler-readiness (dla Googlebota) to inny problem niż agent-readiness.
Skala jest już realna. Comet na iOS, Android, macOS i Windows. Edge z Copilot na setkach milionów urządzeń. Claude in Chrome dla wszystkich użytkowników Claude. To nie jest przyszłość — to jest ruch który już trafia na strony.
MCP jako standard staje się mostem. Opera Neon z MCP Connector + Claude + n8n w jednym środowisku to zapowiedź ekosystemu gdzie strony wystawiają kontrakty akcji a agenty z różnych platform mogą je wykonywać. WebMCP w Chrome Canary idzie w tym samym kierunku.
User agenty zaczynają być identyfikowalne. Google-Agent od marca 2026, zweryfikowany kryptograficznie przez Web Bot Auth z kluczem publicznym pod https://agent.bot.goog. Inne pewnie wkrótce. Monitoring ruchu agentowego przestaje być teorią.
Skala browser-as-agent przestaje być teorią dzięki Chrome. Atlas, Comet, Opera Neon, Edge Copilot, Claude in Chrome — każdy ma swoich użytkowników, ale wszystkie razem to dziesiątki milionów. Chrome z Auto Browse to potencjalnie miliardy. To zmienia kalkulację dla każdego właściciela strony. Agent-readiness przestaje być pytaniem „czy Twoja strona zostanie odwiedzona przez agenta", staje się pytaniem „kiedy Chrome z Auto Browse odwiedzi ją w imieniu klienta i czy będzie wiedział co zrobić". To pytanie ma dwa wymiary — techniczny (czy strona daje agentowi sygnały których potrzebuje) i biznesowy (czy Twoja kategoria produktów lub usług jest tym co użytkownicy będą delegować agentom najpierw).
Always-on zmienia model w dłuższym horyzoncie. Reaktywne agenty (Atlas, Comet, Auto Browse) czekają aż użytkownik o coś poprosi. Gemini Spark od Google reprezentuje inny model — agent działa proaktywnie w tle, monitorując kontekst i sam inicjując akcje. To wciąż wczesna implementacja, dostępna w jednym premium tier u jednego dostawcy, ale wskazuje kierunek. Strona regularnie odwiedzana przez użytkownika może w przyszłości być proaktywnie monitorowana przez jego always-on agenta. To zmienia logikę cykli odwiedzin: zamiast czekać aż użytkownik wróci, treść może być automatycznie weryfikowana co kilka godzin czy dni przez agenta działającego w jego imieniu.










