Czym jest warstwa web w agentic web?

Warstwa web to pierwsza i najbardziej dojrzała warstwa agentic web — obejmuje strony internetowe, blogi, dokumentację i portale. To tu agent AI zaczyna swoją pracę: odwiedza stronę, odczytuje HTML bez renderowania JavaScript, przetwarza dane strukturalne i pliki konfiguracyjne. Warstwa web jest fundamentem — bez niej pozostałe warstwy (commerce, enterprise, IoT, sieci, cybersec) nie mają na czym stać.

Co to jest czytelność strony dla agenta AI?

Czytelność to zdolność strony do bycia odczytaną przez agenta AI bez renderowania JavaScript. Agent nie ma przeglądarki, nie scrolluje, nie klika. Wysyła zapytanie HTTP i przetwarza odpowiedź. Jeśli treść jest generowana dynamicznie przez JavaScript — agent widzi pustą stronę. Prosty test: wyłącz JavaScript w przeglądarce i odśwież stronę. To co widzisz, widzi agent. Czytelność obejmuje też semantyczny HTML (tagi main, article, nav, header, footer), logiczną hierarchię nagłówków (jeden H1, logiczne H2 i H3) oraz atrybuty alt na obrazach.

Co to jest llms.txt i dlaczego jest ważny?

Llms.txt to plik tekstowy w katalogu głównym strony — mapa serwisu dla modeli językowych. Agent który znajdzie llms.txt wie czym jest firma, jakie ma usługi i gdzie szukać kluczowych informacji, zanim odwiedzi pierwszą podstronę. Bez llms.txt agent skanuje stronę na oślep. W Polskim Raporcie AI-Readiness 2026 (maj 2026, 165 stron) llms.txt miało 23% badanych stron — głównie firmy technologiczne i SaaS. Generator llms.txt dostępny na iFox.pl, wdrożenie zajmuje 15 minut.

Co to są Content Signals i jak je wdrożyć?

Content Signals to dyrektywa w pliku robots.txt, która deklaruje politykę treści wobec agentów AI. Trzy sygnały: search (zgoda na indeksowanie do wyszukiwania), ai-input (zgoda na używanie treści jako kontekstu w odpowiedziach AI), ai-train (zgoda lub zakaz trenowania modeli). Przykład: 'Content-Signal: search=yes, ai-input=yes, ai-train=no'. Standard wprowadzony przez Cloudflare we wrześniu 2025, z umocowaniem prawnym w Artykule 4 Dyrektywy UE 2019/790. W badaniu 165 polskich stron Content Signals miały zaledwie 4 strony (2,4%). Generator robots.txt z Content Signals dostępny na iFox.pl.

Jak schema.org wpływa na widoczność dla agentów AI?

Schema.org i JSON-LD to dane strukturalne które mówią agentowi AI co jest czym na stronie. Organization z pełnymi danymi firmy, Person dla autora lub właściciela, FAQ schema dla sekcji z pytaniami, BreadcrumbList dla podstron. W badaniu 165 polskich stron schema.org miało 75% stron — ale obecność to nie to samo co kompletność. Agent który dostaje Organization z samą nazwą i URL-em dostaje inne dane niż agent który dostaje Organization z sameAs, contactPoint i Person z numerem PIBR. Generator schema.org dostępny na iFox.pl.

Jak sprawdzić gotowość mojej strony na agentów AI?

Najszybszy sposób to GEO Checker na iFox.pl — wpisujesz domenę, dostajesz wynik 0-100 w sześciu filarach (czytelność, struktura danych, odkrywalność, operacyjność, tożsamość, governance) w 5 sekund, bezpłatnie. Średni wynik polskich stron branżowych w badaniu maj 2026 to 47,5/100. Próg AI-Ready zaczyna się od 85/100. Żadna z 165 badanych stron nie osiągnęła tego progu. Pełny raport z metodologią dostępny na webflux.pl/raport-ai-readiness-2026/

Jaka jest różnica między SEO a agent-readiness?

SEO optymalizuje stronę pod kątem tego, żeby bot wyszukiwarki ją znalazł i wysoko ocenił w wynikach. Agent-readiness optymalizuje pod kątem tego, żeby agent AI mógł na stronie działać w imieniu użytkownika — czytać, rozumieć, rekomendować, rezerwować. Część pracy się pokrywa: semantyczny HTML, szybkość ładowania, dane strukturalne. Ale agent-readiness wychodzi dalej. SEO nie pyta czy formularz jest przyjazny dla automatyzacji. Agent-readiness pyta. SEO nie pyta czy llms.txt istnieje. Agent-readiness pyta. SEO nie pyta o politykę Content Signals. Agent-readiness pyta.

Od czego zacząć wdrożenie agent-readiness na stronie?

Pięć kroków w kolejności trudności i wpływu: (1) llms.txt — 15 minut, generator na iFox.pl; (2) robots.txt z regułami dla AI — 10 minut, generator na iFox.pl; (3) Schema Organization i Person JSON-LD — 30 minut, generator na iFox.pl, wklejasz w WordPress przez RankMath lub wtyczkę Headers and Footers; (4) FAQ schema — 1 godzina, jeśli masz sekcję FAQ na stronie; (5) GEO Checker na iFox.pl — sprawdź aktualny wynik i co jeszcze jest do poprawienia. Jeśli wolisz zlecić wdrożenie — Studio.iFox.pl oferuje pakiet Wdrożenie + Raport Agent-Readiness z wynikiem 80+/100.

Agentic Web — Warstwa Web. Co już działa i co polska sieć ma do nadrobienia.

Zaczynam od warstwy najprostszej do zrozumienia i najtrudniejszej do zaakceptowania w pełnym wymiarze.

Warstwa web — strony internetowe, blogi, dokumentacja, portale — jest najczęściej omawianą częścią agentic web w polskim rynku. To tu zaczęła się dyskusja o llms.txt, o robots.txt dla AI, o schema.org jako sygnale dla modeli językowych. To tu polskie agencje piszą artykuły o GEO i o tym, że „trzeba być gotowym na agentów AI”.

I to właśnie tu przepaść między tym, co się mówi, a tym, co jest wdrożone, jest największa.

W maju 2026 sprawdziłem 165 polskich stron branżowych. Wyniki opisałem w Polskim Raporcie AI-Readiness 2026. Jeden wniosek do zapamiętania: żadna strona w badanej próbie nie osiągnęła progu AI-Ready. Najwyższy wynik: 72/100. Próg AI-Ready zaczyna się od 85.

Warstwa web w Polsce jest dojrzała w dyskusji. Nie jest dojrzała w praktyce.

Co agent AI robi na Twojej stronie

Zanim powiem co jest do wdrożenia, warto zatrzymać się przy tym, co agent faktycznie robi gdy odwiedza stronę.

Nie ma przeglądarki. Nie scrolluje. Nie klika w animacje. Nie widzi kolorów ani layoutu. Wysyła zapytanie HTTP, otrzymuje odpowiedź i przetwarza to co dostał.

Najpierw szuka pliku robots.txt — żeby wiedzieć, kto go wpuścił i co mu wolno. Potem szuka llms.txt — żeby dostać mapę serwisu zanim zacznie skanować podstrony. Potem przetwarza HTML strony głównej — sprawdza czy treść jest dostępna bez JavaScript, czy nagłówki tworzą logiczną hierarchię, czy dane strukturalne mówią mu kto i co. Jeśli tego nie znajdzie — skanuje na oślep. Dostaje to co dostaje.

To jest kluczowa różnica między optymalizacją pod Google a optymalizacją pod agentów. Google ma bota który indeksuje i rankuje. Agent ma zadanie i działa w imieniu użytkownika. Cel jest inny. Oczekiwania są inne. Dane które są wystarczające dla Googlebota mogą być zupełnie niewystarczające dla agenta który ma coś zrobić — zarekomendować, zarezerwować, odpowiedzieć na konkretne pytanie.

Warstwa 1 — czytelność

Fundament. Agent który nie może odczytać strony bez renderowania JavaScript nie skorzysta z żadnej kolejnej warstwy.

Co to znaczy w praktyce: treść musi być w HTML, nie budowana dynamicznie przez skrypty. Strony oparte na React, Vue czy Next.js z renderowaniem po stronie klienta mają tu największy problem — agent dostaje pusty div zamiast treści. WordPress z Divi jest pod tym względem bezpieczniejszy, bo treść trafia do HTML natywnie. Ale każdy element oparty na lazy load, każda sekcja ładowana po scrollu, każdy lightbox — warto sprawdzić.

Test jest prosty. Wyłącz JavaScript w przeglądarce i odśwież stronę. To co widzisz — widzi agent.

Drugi element czytelności to semantyczny HTML. Znaczniki <main>, <article>, <nav>, <header>, <footer> zamiast generycznych <div>. Hierarchia nagłówków — jeden <h1>, logiczne <h2> i <h3> jako spis treści. Atrybut alt na obrazach który coś znaczy, nie jest pustym stringiem.

Trzeci element — czas odpowiedzi serwera. W badaniu 165 stron, webflux.pl odpowiadał w 1398ms. bdaudyt.pl — 223ms. Agent który obsługuje wiele zapytań równolegle preferuje szybkie serwery. To nie jest element najważniejszy, ale jest mierzalny.

Stan w polskim rynku: HTTPS ma 100% stron w próbie. Semantyczny HTML — wyższy odsetek niż się spodziewałem, ale jakość nagłówków jest nierówna. Najczęstszy problem: strony gdzie designerskie decyzje („tu H2 wygląda lepiej niż H3″) niszczą hierarchię semantyczną.

Warstwa 2 — struktura danych

Schema.org i JSON-LD. Dane strukturalne które mówią agentowi co jest czym.

Co mierzę: obecność schema Organization z pełnymi danymi firmy, Person dla autora lub właściciela, FAQ schema dla sekcji z pytaniami i odpowiedziami, BreadcrumbList dla podstron, Open Graph dla mediów społecznościowych.

Stan w polskim rynku: 75% stron w próbie ma schema.org — to wynik lepszy niż się spodziewałem. Problem leży gdzie indziej: obecność schema.org to nie to samo co kompletność schema.org.

Agent który dostaje Organization z samą nazwą i URL-em dostaje schema.org. Ale agent który dostaje Organization z sameAs wskazującym na LinkedIn, KRS, profil Google Business, z contactPoint ze szczegółami kontaktu, z founderwskazującym na Person z numerem PIBR — dostaje coś całkowicie innego.

Różnica między tymi dwoma scenariuszami to różnica między „agent wie że istnieje firma o tej nazwie” a „agent wie kto za nią stoi, jak ją zweryfikować i jak się skontaktować”.

W badaniu warstwę struktury danych sprawdzam osobno dla Organization, Person, FAQ, BreadcrumbList i spójności między schema a treścią. Pełna spójność — czy cena w schema.org zgadza się z ceną widoczną na stronie — jest trudna do zautomatyzowania, więc ją szacuję. Ale znane są przypadki stron, gdzie schema podaje inną cenę niż HTML. Agent traktuje to jako sygnał braku wiarygodności.

Warstwa 3 — odkrywalność

robots.txt, llms.txt, Content Signals. To jest warstwa, w której polskie strony mają największe zaległości.

robots.txt: 88% stron w próbie ma robots.txt. To dobry wynik. Ale w ilu z nich są reguły specyficzne dla agentów AI — GPTBot, ClaudeBot, PerplexityBot, Google-Extended? W próbie z raportu: znacznie mniej. Domyślny robots.txt z Yoast albo RankMath nie zawiera tych reguł. To plik który był pisany dla wyszukiwarek, nie dla agentów.

Brak reguł dla AI crawlerów nie znaczy że strona jest zablokowana. Znaczy że strona nie ma świadomej polityki. Agent nie wie czy jest mile widziany czy tolerowany. Wie tylko że nikt nie pomyślał o nim przy konfiguracji.

llms.txt: 23% stron w próbie. To jest liczba, która mnie zaskoczyła — spodziewałem się mniej. Ale wśród stron które llms.txt mają dominują firmy technologiczne i SaaS. W e-commerce i agencjach digital — znacznie rzadziej. To jest plik który mówi agentowi czym jest serwis zanim zacznie go skanować. 324 słów opisu i lista kluczowych podstron — to wystarczy żeby agent wiedział gdzie jest i co znajdzie. Bez llms.txt skanuje na oślep.

Content Signals: 4 strony z 165. 2,4%. To jest deklaracja polityki treści — search=yes, ai-input=yes, ai-train=no jako linia w robots.txt. Standard Cloudflare z września 2025, z umocowaniem prawnym w Artykule 4 Dyrektywy UE 2019/790. Praktycznie nikt tego nie wdrożył. To jest najrzadszy element w całym badaniu.

Warstwa 4 — operacyjność

Czy agent może coś zrobić na stronie — nie tylko przeczytać.

Formularz kontaktowy bez CAPTCHA. API lub endpoint danych (WordPress REST API jest dostępny domyślnie, ale czy jest otwarty dla agentów?). Dane kontaktowe w maszynowo czytelnej formie — tel: i mailto: linki, ContactPoint schema.

W badaniu widzę dużo stron z formularzem za reCAPTCHA, który agent nie przejdzie. To jest celowy wybór — właściciel nie chce automatycznych wysyłek. Ale konsekwencja jest taka, że agent który ma zadanie „umów konsultację”może tylko pokazać użytkownikowi numer telefonu, nie może złożyć zapytania.

To nie jest błąd. To jest decyzja. Ale warto ją podjąć świadomie.

Warstwa 5 — tożsamość

Kto stoi za stroną? Czy agent może to zweryfikować?

W badaniu sprawdzam: Organization z sameAs, Person JSON-LD dla autora, NIP/KRS w stopce, politykę prywatności z linkiem. Tożsamość 10/10 w badaniu miała jedna strona — bdaudyt.pl, kancelaria biegłego rewidenta. Żadna strona z raportu nie osiągnęła kompletem w tym filarze.

Dlaczego tożsamość ma znaczenie w kontekście agentów AI? Bo modele językowe mają tendencję do preferowania źródeł o weryfikowalnej tożsamości przy cytowaniu i rekomendowaniu. Strona która mówi „jesteśmy ekspertami” i strona która mówi „oto numer PIBR naszego biegłego rewidenta, oto KRS, oto profil na LinkedIn, oto sameAs” — są przez agenta traktowane inaczej.

Warstwa 6 — governance

Świadoma polityka wobec agentów AI. Kogo wpuszczasz, co im wolno, czego zabraniasz.

Większość polskich stron ma governance przez domyślne ustawienia — czyli przez brak decyzji. Agent może crawlować bo robots.txt na to pozwala. Może pobierać treść do treningu bo nie ma Content Signals z ai-train=no. Może używać treści jako kontekstu dla odpowiedzi bo nie ma ai-input zadeklarowanego.

Brak deklaracji nie jest ani zgodą ani odmową. Jest brakiem polityki. W miarę jak standardy dojrzeją — brak polityki będzie coraz bardziej wyjątkiem, nie normą.

Co możesz wdrożyć dziś

Pięć kroków w kolejności trudności i wpływu.

Krok 1 — llms.txt. Piętnaście minut. Generator na iFox.pl, wgrywasz plik. Agent który trafi na Twoją stronę będzie wiedział czym jest firma i gdzie szukać kluczowych informacji.

Krok 2 — robots.txt z regułami AI. Dziesięć minut. Generator na iFox.pl, zastępujesz obecny robots.txt. Reguły dla 14 agentów AI, Content Signals, klauzula Cloudflare z Artykułem 4 UE.

Krok 3 — Schema Organization i Person. Trzydzieści minut. Generator na iFox.pl, wklejasz JSON-LD w WordPress przez RankMath lub Headers and Footers. Pełne dane firmy, dane autora, sameAs wskazujące na weryfikowalne zewnętrzne profile.

Krok 4 — FAQ schema. Jedna godzina. Jeśli masz sekcję FAQ na stronie — ustrukturyzuj ją w FAQPage schema. Agent który dostaje pytanie na które odpowiedź jest w Twojej FAQ może ją wyciągnąć bezpośrednio z danych strukturalnych.

Krok 5 — GEO Checker. Pięć sekund. Sprawdź gdzie jesteś. Wynik 0–100, sześć filarów, konkrety co jest do poprawienia. Nie zgaduj.

Co jest poza tą warstwą

Warstwa web jest wejściem. Ale agentic web to sześć warstw — i każda kolejna zakłada że poprzednia jest zrobiona.

Wpis 2 tej serii dotyczy warstwy commerce. Agenty zakupowe ChatGPT, Copilot Checkout, protokoły UCP i ACP. To jest warstwa która dla polskich sklepów internetowych staje się pilna właśnie teraz — bo Instant Checkout jest produkcyjny, a polskie sklepy mają średnio 43/100 w GEO Checkerze.

Warstwa web jest fundamentem. Bez niej reszta nie ma na czym stać.

Sprawdź wynik swojej strony: ifox.pl/geo-checker/

Generator llms.txt: ifox.pl/generator-llms/

Generator robots.txt z Content Signals: ifox.pl/generator-robots-txt/

Słownik pojęć tej serii: webflux.pl/slownik-agentic-web/

Raport AI-Readiness 2026: webflux.pl/raport-ai-readiness-2026/

Sprawdź słownik pojęć Agentic-Web

Przejdź do Strefy Divi

Agentic Web — Warstwa Enterprise. MCP, asystenci wewnętrzni i czemu polskie korporacje są spóźnione.

przez Łukasz | maj 11, 2026 | Agentic Web, warstwy

Warstwa web dotyczy stron. Warstwa commerce dotyczy sklepów. Warstwa enterprise dotyczy czegoś szerszego — systemów firmowych, B2B, dokumentacji wewnętrznej, zasobów które firma udostępnia pracownikom i klientom. I tu jest jedno fundamentalne przesunięcie, które warto...

Agentic Web — Warstwa Commerce. Handel bez kliknięcia i co to znaczy dla polskiego sklepu.

przez Łukasz | maj 10, 2026 | Agentic Web, warstwy

W poprzednim wpisie pisałem o warstwie web — stronach, blogach, dokumentacji. O tym że agent AI odwiedza stronę, czyta HTML, szuka llms.txt i robots.txt, przetwarza dane strukturalne. To jest warstwa czytelności. Warstwa commerce jest inna. Agent nie tylko czyta....

bdaudyt.pl — co zobaczył agent na stronie, którą zbudował biegły rewident myślący o agentach

przez Łukasz | maj 10, 2026 | Agentic Web, Case Studies

Po publikacji Polskiego Raportu AI-Readiness 2026 puściłem tego samego agenta na bdaudyt.pl — stronę firmy audytorskiej z Wrocławia, prowadzonej przez biegłego rewidenta Beatę Wachowicz. Nie jest to klient Studio.iFox. Nie przebudowywałem tej strony. Nie wdrażałem na...

Co zobaczył agent po wdrożeniu — webflux.pl i cyberflux.pl oczami własnego crawlera

przez Łukasz | maj 10, 2026 | Agentic Web, Case Studies

Dwa dni temu opublikowałem raport o gotowości 165 polskich stron na agentów AI. Średni wynik: 47,5/100. Żadna strona nie osiągnęła progu AI-Ready. Zaraz po publikacji uruchomiłem ten sam agent — ten sam kod w Go, ta sama metodologia — na webflux.pl i cyberflux.pl. Nie...

agencja-szalowski.pl - case study przygotowania serwisu na agent-readiness

Agencja-szablowski.pl jako case study agent-readiness: od lokalnej wizytówki do serwisu gotowego na agenty AI

przez Łukasz | maj 7, 2026 | Agentic Web, Case Studies

Zaczęło się od prostego pytania które zadajemy sobie przy każdym nowym projekcie: czy strona którą właśnie oddaliśmy klientowi jest gotowa na to jak działa dziś internet? agencja-szablowski.pl to strona którą zbudowało iFOX STUDIO dla Roberta Szabłowskiego —...

Cyberflux.pl - case study przygotowania serwisu na agent-readiness

CyberFlux.pl jako case study agent-readiness: od niewidocznego bloga do serwisu gotowego na agenty AI

przez Łukasz | maj 5, 2026 | Agentic Web, Case Studies

Zaczęło się od niekomfortowego pytania: czy CyberFlux — serwis który od marca 2026 opisuje jak agenty AI są atakowane — sam jest gotowy na agenty AI? Sprawdziłem w checkerze agent-readiness WebFlux.pl. Wynik: poniżej 40%. Serwis który analizuje prompt injection, MCP...

Twoja strona może atakować agentów AI — i nie wiedzieć o tym

przez Łukasz | maj 2, 2026 | Agentic Web

Przez ostatnią dekadę budowaliśmy strony pod jeden typ czytelnika: człowieka z myszką i ekranem. Optymalizowaliśmy kolory przycisków, skracaliśmy nagłówki, dbaliśmy o to żeby przekaz był zrozumiały w pięć sekund. Dziś Twoją stronę czyta ktoś zupełnie inny. Agent AI —...

Pięć sygnałów, że narracja wyprzedza rzeczywistość — co pokazała seria 'Czego nie wdrożycie w 2026′

przez Łukasz | kwi 26, 2026 | Agentic Web

Pięć poprzednich wpisów tej serii dotyczyło pięciu różnych rzeczy. Pay-per-crawl jako monetyzacja. llms.txt jako standard. WebMCP jako produkcyjna usługa. Instant Checkout jako kanał sprzedaży. Tożsamość agenta jako rozwiązany problem. Każdy z tych tematów ma własną...

Tożsamość agenta w 2026 — dlaczego trzy istniejące rozwiązania to nie jest jeszcze rozwiązany problem

przez Łukasz | kwi 26, 2026 | Agentic Web

W komunikatach branżowych z 2025 i 2026 powtarza się pewien zestaw słów, który brzmi jak deklaracja gotowości. „Tożsamość agenta jest standardem”. „Mamy już protokoły uwierzytelnienia”. „Kryptograficzna weryfikacja działa produkcyjnie”. Te zdania...

ACP w 2026 — co OpenAI wycofało w marcu i dlaczego polski internet jeszcze tego nie zauważył

przez Łukasz | kwi 26, 2026 | Agentic Web

W październiku 2025 OpenAI i Stripe ogłosili coś, co wyglądało na rewolucję w handlu internetowym. Agentic Commerce Protocol — otwarty standard, który miał pozwolić agentom AI kupować produkty w imieniu użytkowników bez wychodzenia z rozmowy z ChatGPT. Razem z...

« Starsze Wpisy

Agentic Web — Warstwa Web. Co już działa i co polska sieć ma do nadrobienia.

Co agent AI robi na Twojej stronie

Warstwa 1 — czytelność

Warstwa 2 — struktura danych

Warstwa 3 — odkrywalność

Warstwa 4 — operacyjność

Warstwa 5 — tożsamość

Warstwa 6 — governance

Co możesz wdrożyć dziś

Co jest poza tą warstwą

Agentic Web — Warstwa Enterprise. MCP, asystenci wewnętrzni i czemu polskie korporacje są spóźnione.

Agentic Web — Warstwa Commerce. Handel bez kliknięcia i co to znaczy dla polskiego sklepu.

bdaudyt.pl — co zobaczył agent na stronie, którą zbudował biegły rewident myślący o agentach

Co zobaczył agent po wdrożeniu — webflux.pl i cyberflux.pl oczami własnego crawlera

Agencja-szablowski.pl jako case study agent-readiness: od lokalnej wizytówki do serwisu gotowego na agenty AI

CyberFlux.pl jako case study agent-readiness: od niewidocznego bloga do serwisu gotowego na agenty AI

Twoja strona może atakować agentów AI — i nie wiedzieć o tym

Pięć sygnałów, że narracja wyprzedza rzeczywistość — co pokazała seria 'Czego nie wdrożycie w 2026′

Tożsamość agenta w 2026 — dlaczego trzy istniejące rozwiązania to nie jest jeszcze rozwiązany problem

ACP w 2026 — co OpenAI wycofało w marcu i dlaczego polski internet jeszcze tego nie zauważył

Agentic Web

Nawigacja

Bądź na bieżąco

Zapisz się na newsletter