Przez lata projektowaliśmy interfejs przede wszystkim dla oczu.
Myśleliśmy o układzie, kolorze, hierarchii, kontraście. O tym, gdzie użytkownik spojrzy najpierw, gdzie zatrzyma wzrok, w którym miejscu naturalnie kliknie. Przycisk był większy, jeśli miał być ważny. Najistotniejszy element lądował wyżej. Formularz prowadził wzrokiem tak, by kolejne pola wydawały się logiczną kontynuacją poprzednich.
To działało, bo człowiek czyta obraz.
Rozpoznaje wzorce.
Uczy się interfejsów intuicyjnie.
Nie musi analizować przycisku logicznie, żeby wiedzieć, że „Kup teraz” oznacza działanie. Wystarczy, że wygląda jak coś, co już kiedyś widział.
Ale w pewnym momencie pojawił się ktoś, kto obrazu nie czyta.
Agent nie widzi layoutu
Agent AI nie patrzy na Twoją stronę w taki sposób jak człowiek. Nie wie, że zielony oznacza „idź dalej”. Nie domyśla się, że prawa kolumna zawiera podsumowanie, a lewa główną treść. Nie wyczuwa, że karta produktu po lewej jest ważniejsza od tej po prawej, bo ma większe zdjęcie i mocniejszy cień.
On nie interpretuje wizualnej sugestii.
On czyta strukturę.
Dla agenta strona nie jest kompozycją. Jest zbiorem relacji. Zestawem elementów, które mają określone role, a nie określony wygląd. To, co dla człowieka jest layoutem, dla systemu jest instrukcją działania.
I to zmienia wszystko.
UI zawsze był językiem — tylko nie zdawaliśmy sobie z tego sprawy
Kiedy człowiek widzi przycisk „Kup teraz”, nie rozkłada go na czynniki pierwsze. Nie analizuje, czy to jest element button, a, czy div stylizowany CSS-em. Reaguje emocjonalnie i kontekstowo. Wie, gdzie jest w procesie. Widzi koszyk, cenę, nazwę produktu. Rozumie sytuację.
Agent nie może reagować w ten sposób. Nie powinien zgadywać. Nie może opierać się na intuicji. Jeśli na stronie znajdują się trzy przyciski z napisem „Dalej”, człowiek wybierze właściwy, bo rozumie kontekst wizualny i pamięta, na jakim etapie się znajduje. Agent widzi trzy równorzędne polecenia.
Nie pomylił się.
Po prostu nie miał wystarczającej informacji.
To pierwszy moment w historii webu, w którym interfejs może być oczywisty dla człowieka i jednocześnie nieczytelny dla wykonawcy.
Intuicyjne nie znaczy operacyjne
Wyobraź sobie ikonę koszyka bez tekstu. Każdy użytkownik wie, że kliknięcie jej przeniesie do podsumowania zamówienia. To oczywiste. Ale dla systemu to tylko element graficzny, chyba że został jednoznacznie opisany.
Albo formularz, w którym pola mają wyłącznie placeholder zamiast etykiety. Dla człowieka wystarczająco czytelne. Dla agenta — niejednoznaczne, bo placeholder znika po wpisaniu pierwszej litery, a pole nie posiada trwałej informacji o swojej roli.
Przez lata mogliśmy sobie pozwolić na takie skróty, ponieważ projektowaliśmy głównie dla percepcji wizualnej. Dziś zaczynamy projektować dla wykonania zadania.
A wykonanie wymaga jednoznaczności.
Semantyka przestaje być uprzejmością
ARIA, role, poprawne znaczniki HTML — długo traktowaliśmy je jako uprzejmość dla czytników ekranowych albo jako „dodatkową warstwę” dla dostępności. Coś ważnego, ale niekoniecznie kluczowego dla działania biznesu.
Dziś zaczynają pełnić zupełnie inną funkcję. Stają się opisem znaczenia. Kontraktem między systemami. Interfejs przestaje być tylko reprezentacją systemu dla człowieka i zaczyna być również instrukcją dla innego systemu.
Przycisk nie jest już grafiką, którą można dowolnie stylizować.
Jest poleceniem.
Pole tekstowe nie jest już tylko prostokątem na ekranie.
Jest oczekiwaniem konkretnej informacji.
Semantyka przestaje być dekoracją. Staje się fundamentem operacyjności.

Przykład niepoprawnej semantyki na przycisku zawierającym jedynie ikonę SVG
Projektujemy dla wykonawcy
Człowiek interpretuje i dopowiada sobie brakujące elementy. Agent musi wiedzieć. Człowiek potrafi zgadnąć, że ma kliknąć ten konkretny przycisk, bo widzi proces zakupowy jako całość. Agent potrzebuje jasnego sygnału: to jest następny krok, to jest finalizacja, to jest powrót.
W tym sensie interfejs zaczyna przypominać API — tylko że wizualne. Jest zestawem jasno określonych akcji, które można wykonać bez domysłów.
To subtelna, ale fundamentalna zmiana. UI przestaje być tylko warstwą estetyczną, a zaczyna być protokołem działania.
UI jako protokół
Tak jak HTTP opisuje, w jaki sposób komunikują się komputery, tak semantyczny interfejs zaczyna opisywać, jak wykonać zadanie w środowisku wizualnym. Strona internetowa przestaje być jedynie widokiem. Staje się zestawem możliwych operacji.
Najpierw czytał ją człowiek.
Teraz czyta ją również agent.
I obaj muszą dojść do tego samego wniosku: co można zrobić i w jakiej kolejności.

Trzy sekcje z tym samym tekstem przycisków Dalej w kodzie HTML

Kod HTML pokazujący poprawne etykiety aria-label przycisków
Zmiana sposobu testowania
Przez lata podstawowe pytanie brzmiało: „czy użytkownik to zrozumie?”. Dziś coraz częściej powinniśmy zadawać inne: „czy da się to wykonać bez zgadywania?”.
Bo kiedy interfejs przestaje być wyłącznie wizualny, największym błędem nie jest brzydki layout ani niespójna typografia. Największym błędem jest niejednoznaczne polecenie.
I właśnie od tego momentu potrzebne są narzędzia, które nie oceniają wyglądu strony, lecz jej wykonalność. Narzędzia, które potrafią sprawdzić, czy interfejs jest czytelny nie tylko dla oka, ale również dla systemu, który ma na jego podstawie działać.
UI nie kończy się już na użytkowniku.
Ma drugiego czytelnika.
A to oznacza, że zaczynamy projektować w nowym wymiarze odpowiedzialności.




