GPT-5.5 nie jest kolejną aktualizacją chatbota. To pierwszy model OpenAI, który został zaprojektowany od podstaw z myślą o pracy bez nadzoru człowieka — i ta zmiana optyki jest ważniejsza niż jakikolwiek benchmark.
Wcześniejsze modele pytały: co chcesz, żebym zrobił? GPT-5.5 pyta: co chcesz osiągnąć? — i sam planuje kroki. Dostaje wieloetapowe, nieuporządkowane zadanie i realizuje je: przeszukuje sieć, pisze kod, operuje oprogramowaniem, tworzy dokumenty, wraca do wcześniejszych kroków gdy coś nie wychodzi. Nie wymaga prowadzenia za rękę.
To przesunięcie ma bezpośrednie konsekwencje dla pojęcia agent-readiness.
Agent przyszedł. Czy strona go rozumie?
Dotychczas agent-readiness była pojęciem futurystycznym — warto zadbać, bo kiedyś agenty będą ważne. GPT-5.5 usuwa ten margines czasu. Model jest dostępny dla użytkowników płatnych od 23 kwietnia 2026, API — od następnego dnia. To nie zapowiedź. To rzeczywistość produkcyjna.
Agent odwiedzający stronę internetową dziś nie jest już prostym skryptem wysyłającym zapytania do wyszukiwarki. To system, który potrafi zaplanować cel, odczytać strukturę serwisu, wybrać odpowiednią ścieżkę i podjąć działanie — zakupić, zarezerwować, wypełnić formularz, wygenerować raport. Jeżeli strona nie dostarcza mu właściwych sygnałów — kim jest właściciel, co tu można zrobić, w jakiej kolejności, na jakich warunkach — agent albo błądzi, albo odpada na etapie planowania.
Co zmienia GPT-5.5 w praktyce?
Trzy rzeczy są szczególnie istotne z perspektywy gotowości serwisów.
Po pierwsze, computer use — zdolność agenta do obsługi interfejsu graficznego tak jak robi to człowiek: klika, wypełnia formularze, nawiguje między zakładkami. Oznacza to, że strony zbudowane wyłącznie pod wizualny odbiór użytkownika mogą być równie dobrze obsługiwane przez agenta. Ale strony z niejasną strukturą, ukrytymi akcjami lub treścią schowaną za JavaScriptem nadal pozostają czarną skrzynką — computer use nie zastępuje dobrej architektury informacji, bo agent który musi zgadywać, popełnia błędy.
Po drugie, efektywność tokenowa. Model wykonuje te same zadania zużywając znacznie mniej tokenów niż poprzednicy. Agenci działający w ramach ograniczonych budżetów będą przetwarzać więcej stron, ale powierzchowniej. Treść, która nie komunikuje swojej wartości w pierwszych zdaniach, zostanie pominięta.
Po trzecie, długi horyzont działania. GPT-5.5 potrafi utrzymać kontekst przez złożone, wieloetapowe projekty. Serwis, który dziś dostarcza agentowi fragmentaryczne informacje rozsiane po wielu podstronach bez wyraźnej mapy — staje się trudnym partnerem do współpracy.
Nie można nie wspomnieć o Claude
Nie można jednak nie wspomnieć o Claude.ai od Anthropic, który w tym wyścigu nie tylko nie odstaje — w kilku kluczowych obszarach wyznacza własne standardy. I to mierzalne.
Organizacja METR — niezależny instytut badający autonomię agentów AI — mierzy coś, co nazywa task-completion time horizon, czyli horyzont czasowy agenta. To miara określająca jak długo model potrafi samodzielnie działać zanim zawiedzie przy złożonym, wieloetapowym zadaniu. Wyniki podawane są w dwóch progach: przy 50% skuteczności i przy 80%. Im dłuższy horyzont, tym bardziej agent nadaje się do pracy bez nadzoru człowieka.
Claude Opus 4.6 osiąga przy progu 50% wynik 14 godzin i 30 minut. To najdłuższy zmierzony horyzont wśród wszystkich dostępnych modeli. Oznacza to, że agent oparty na Claude potrafi samodzielnie realizować złożone zadanie przez ponad pół doby — planować, korygować błędy, kontynuować — zanim będzie potrzebował interwencji człowieka.
Na Terminal-Bench 2.0 — benchmarku mierzącym zdolność agenta do pracy w rzeczywistym środowisku terminalowym, na prawdziwych repozytoriach kodu, z prawdziwymi błędami — Claude Opus 4.6 zajmuje pierwsze miejsce spośród wszystkich testowanych modeli.
O ile więc GPT-5.5 stawia na jednego zunifikowanego agenta który sam decyduje kiedy myśleć głębiej a kiedy działać szybciej, Claude poszedł dalej: Opus 4.6 wprowadza Agent Teams — architekturę wieloagentową, w której wiele instancji modelu działa równolegle, każda na innym fragmencie zadania. Jedna analizuje dane, druga pisze kod, trzecia aktualizuje dokumentację — jednocześnie, nie sekwencyjnie.
Z perspektywy agent-readiness ta różnica ma znaczenie praktyczne. Pojedynczy agent GPT-5.5 odwiedza serwis jak jeden, bardzo kompetentny użytkownik — liniowo, z własnym planem. Agent Teams Claude może uderzyć w stronę z kilku kierunków naraz. Serwis nieprzygotowany na równoległy ruch agentowy może zachowywać się nieprzewidywalnie.
Infrastruktura agentyczna to nie metafora
OpenAI wprost nazywa to, co buduje, globalną infrastrukturą dla agentic AI. Anthropic odpowiada najdłuższym horyzontem autonomii w branży. Oba podejścia zmierzają w tym samym kierunku — modele będą coraz lepiej planować, coraz skuteczniej działać, coraz rzadziej potrzebować człowieka w pętli decyzyjnej.
Serwisy, które przygotują się na to teraz — czytelna tożsamość, jasna mapa treści, dane strukturalne, dedykowane ścieżki dla agentów — zyskają przewagę nie w przyszłości, lecz w tym kwartale.
GPT-5.5 nie puka do drzwi. Już wszedł. Ale Claude był tam przed nim.

