Atlas (OpenAI)

Natywna przeglądarka OpenAI z agentem opartym na rodzinie GPT jako głównym interfejsem — użytkownik wyraża intencję, agent wykonuje sekwencję działań autonomicznie. Najbardziej radykalne wcielenie Agent-in-Browser w 2026. Wydana październik 2025, adopcja masowa poniżej oczekiwań, ale punkt referencyjny dla całej kategorii.

W Polsce nazywane też:

Atlas OpenAIprzeglądarka AtlasOpenAI Atlasagent Atlas

Październik 2025. OpenAI ogłasza Atlas — pierwszą natywną przeglądarkę z agentem AI jako głównym interfejsem, nie jako rozszerzeniem czy plug-inem. To była najbardziej radykalna propozycja zmiany sposobu w jaki korzystamy z internetu od czasu wprowadzenia Chrome’a w 2008. Sześć miesięcy później wiemy lepiej co Atlas zmaterializował, a co nie.

Czym jest Atlas (OpenAI)

Atlas to natywna przeglądarka internetowa OpenAI z agentem opartym na rodzinie GPT zintegrowanym jako główny interfejs — użytkownik wyraża intencję („zarezerwuj wizytę u dentysty na piątek”, „porównaj te trzy laptopy”, „wypełnij formularz kontaktowy”) a agent autonomicznie wykonuje sekwencję działań w przeglądarce: otwiera strony, klika, wypełnia formularze, zbiera dane, prezentuje wynik — reprezentując najbardziej dosłowne wcielenie paradygmatu Agent-in-Browser na rynku w 2026.

Charakterystyka produktowa

Architektura: agent jako pierwszy obywatel UI. Pasek adresu nie jest paskiem URL — jest paskiem intencji. Użytkownik wpisuje co chce zrobić, nie gdzie chce iść. Tradycyjna nawigacja jest dostępna jako fallback dla użytkowników którzy preferują manualne otwieranie stron.

Model: GPT (rodzina), routowany w zależności od złożoności zadania. Proste klasyfikacje idą do tańszego modelu, złożone reasoning do silniejszego.

Cena: po początkowej darmowej fazie wprowadzono płatne plany. Free tier ma ograniczenia czasowe i ilościowe na zadania agentowe. Pełna funkcjonalność wymaga subskrypcji.

Wydanie: października 2025, początkowo macOS, później Windows. Linux nie był priorytetem w pierwszym roku.

Co Atlas zmaterializował (6 miesięcy później)

Działająca autonomiczna nawigacja na stronach z dobrą semantyką HTML i schema.org. Atlas radzi sobie dobrze na ecommerce, rezerwacjach, formularzach kontaktowych — pod warunkiem że strona jest agent-ready.

Computer Use — paradygmat działania przez vision (screenshot) + clicks. Pozwala obsłużyć strony których agent nie potrafi sparsować z DOM. Wolniejsze, droższe, ale działa.

Pamięć kontekstu między sesjami — Atlas pamięta poprzednie zadania i preferencje użytkownika.

Co Atlas nie spełnił

Adopcja masowa: po początkowym hype’ie liczba aktywnych użytkowników w pierwszym kwartale 2026 ustabilizowała się na poziomie kilku milionów — daleko od konkurencji w „klasycznych” przeglądarkach (Chrome 3+ mld).

Stabilność na nieprzewidywalnych stronach: agent zacina się na CAPTCHA, na stronach z dynamicznym JavaScript bez stabilnych selektorów, na flow z mocno niestandardowymi widgetami.

Cena per zadanie: dla zwykłych intencji (otwórz stronę) Atlas jest droższy niż klasyczna przeglądarka. Wartość ujawnia się dopiero przy złożonych zadaniach.

Implikacje dla autora strony

Strony agent-ready dla Atlas są stronami które agent OpenAI potrafi nawigować bez fallbacku do Computer Use. To znaczy: semantyka HTML, schema.org, stabilne selektory ARIA, accessible formularze, brak CAPTCHA blokującej automatyzację.

Eksperyment Salon kosmetyczny vs Claude in Chrome pokazał wzorzec mierzalny też dla Atlasa: agent-ready strona osiąga 40-60% lepszą skuteczność wykonania zadań.

Pozycja Atlasa w krajobrazie 2026

Atlas pozostaje punktem referencyjnym dla Agent-in-Browser, mimo niskiej adopcji masowej. Każda kolejna przeglądarka AI (Comet, Arc Max, Brave Leo) była po części odpowiedzią na Atlasa — kopiowała pomysły lub świadomie się od niego odróżniała. Pełna analiza w Atlas od OpenAI — 6 miesięcy później.

Powiązane pojęcia

Agent w PrzeglądarceParadygmat w którym agent AI jest świadomie wywoływanym gościem przeglądarki — uruchamianym przez użytkownika z konkretnym zadaniem, działającym sesyjnie. Wcielenia: Atlas (OpenAI), Claude in Chrome, Brave Leo. Przeciwwaga dla Browser-as-Agent.Arc MaxZestaw funkcji AI w przeglądarce Arc od The Browser Company — Ask on Page (pytania do strony), 5-Second Previews (podsumowania linków przy hover), auto-naming pobranych plików i kart. Pośrednia pozycja między Agent-in-Browser a Browser-as-Agent — AI niewidoczne jako tryb, użyteczne jako warstwa interakcji.Brave LeoAI-asystent wbudowany w przeglądarkę Brave — z możliwością wyboru backendu modelu (Mixtral, Llama, Claude, GPT przez własny API key) — projektowany z naciskiem na prywatność (zero-knowledge hosting, brak trenowania na promptach). Opt-in, nie silent deployment. Alternatywa dla Agent-in-Browser od dużych vendorów.Przeglądarka-jako-AgentParadygmat w którym przeglądarka zawiera wbudowany lokalny LLM modulujący doświadczenie każdej odwiedzanej strony — bez wyraźnej intencji użytkownika i bez wiedzy autora strony. W przeciwieństwie do Agent-in-Browser (świadomie uruchamiany gość), Browser-as-Agent jest cały czas obecny. Wcielenie: Chrome z Gemini Nano w 500M+ urządzeń.Claude w ChromeRozszerzenie Chrome od Anthropic wykorzystujące Claude do sterowania przeglądarką w imieniu użytkownika — otwieranie stron, klikanie, wypełnianie formularzy, ekstrakcja danych. Niższy próg adopcji niż Atlas (zostajesz w Chrome). Eksperyment WebFlux pokazał 40-60% lepszą skuteczność na stronach agent-ready.Comet (Perplexity)Natywna przeglądarka Perplexity z agentem AI jako interfejsem — pasek adresu działa równocześnie jako pasek zapytań do generatywnej wyszukiwarki, agent może autonomicznie nawigować na stronach. Sprawa PerplexityBot z 2025 (obchodzenie robots.txt) stała się katalizatorem prac nad Web Bot Auth i pay-per-crawl jako branżowymi standardami.GPT-4oFlagowy model OpenAI (maj 2024) — multimodalny system natywnie przetwarzający tekst, obraz i audio w jednym modelu, z wydajnością GPT-4 Turbo przy 2x niższych kosztach. Fundament ChatGPT i OpenAI API. "o" = "omni" — jedna sieć neuronowa dla wszystkich modalności.Obsługa komputera przez agentaZdolność agenta AI do obsługi interfejsu graficznego komputera — przez cykl widzenia ekranu, rozumienia co jest widoczne i wykonywania akcji myszą i klawiaturą — bez potrzeby dostępu do API ani danych strukturalnych. Najbardziej elastyczny ale też najmniej niezawodny sposób dostępu agenta do systemów.Gotowość agentowaZestaw cech strony internetowej decydujący o tym, czy agent AI potrafi ją skutecznie odczytać, zrozumieć i wykonać na niej działanie w imieniu użytkownika.