R.V. Guha stworzył RSS w 1999 — format który pozwolił każdemu serwisowi publikować treść w ustandaryzowany sposób czytelny dla maszyn. Stworzył RDF i stał za Schema.org — fundamentem danych strukturalnych których używa dziś każda strona która chce być rozumiana przez Google i agentów AI. Jeśli ktoś rozumie jak sprawić żeby internet był czytelny dla maszyn, to on.
W maju 2025, jako Technical Fellow w Microsofcie, Guha ogłosił NLWeb na Build 2025. Microsoft porównał to do HTML: „tak jak HTML ułatwił każdemu tworzenie strony, NLWeb ułatwia każdemu tworzenie konwersacyjnego interfejsu dla AI”.
Czym jest NLWeb
NLWeb to otwarty standard Microsoftu ogłoszony na Build 2025 — pozwala każdej stronie internetowej wystawiać konwersacyjny interfejs dla agentów AI przez dwa endpointy: /ask dla zapytań w języku naturalnym i /mcp dla komunikacji agent-agent, używając Schema.org jako bazy wiedzy. Microsoft powiedział wprost: każda instancja NLWeb jest też serwerem MCP.
Dwa endpointy — dwa sposoby rozmowy
/ask przyjmuje pytanie w języku naturalnym i zwraca ustrukturyzowaną odpowiedź JSON opartą na danych Schema.org strony. Agent pyta „jakie masz produkty dla firm poniżej 50 pracowników?” i dostaje gotową odpowiedź — nie link do strony kategorii który musi sparsować.
/mcp wystawia te same możliwości przez protokół MCP — agent-to-agent, maszyna do maszyny, bez warstwy języka naturalnego. To jest punkt wejścia dla agentów które nie potrzebują interpretacji — wiedzą co chcą, wywołują narzędzie.
Schema.org jako baza wiedzy
NLWeb nie wymaga nowej bazy danych ani osobnego indeksu treści. Używa danych Schema.org które strona już ma — produkty, artykuły, organizacje, FAQ. To co Yoast generuje dla Google, NLWeb przekształca w interfejs konwersacyjny dla agentów.
To jest właśnie czemu Yoast ogłosił współpracę z Microsoftem w listopadzie 2025. Mają Schema.org na milionach stron WordPress. NLWeb to warstwa którą mogą dodać na wierzch bez przebudowy — Yoast zbiera Schema.org od lat, Microsoft dostarcza protokół który tę wiedzę udostępnia agentom.
NLWeb vs samodzielna implementacja /ask
Microsoft udostępnił bibliotekę Python która robi ciężką robotę — RAG oparty na Schema.org, obsługa endpointów, integracja z wybranym modelem AI. Można też zbudować własny endpoint /ask zasilony llms-full.txt lub własną bazą wiedzy przekazaną przez Claude API. Efekt funkcjonalnie podobny, różna implementacja.
Różnica jest w semantyce danych: NLWeb zakłada Schema.org jako warstwę znaczenia. Własna implementacja z llms-full.txt jest prostsza wdrożeniowo, ale brakuje jej precyzji strukturalnej którą Schema.org wnosi.
Adopcja i bezpieczeństwo
Shopify, Snowflake, TripAdvisor, Eventbrite i Hearst budują na NLWeb — to production deployments, nie prototypy. Security researchers Aonan Guan i Lei Wang znaleźli podatność krótko po premierze. Microsoft załatał ją 1 lipca 2025, nie przypisując CVE — co badacze krytykowali. Fakt że podatność znaleziono szybko i publicznie zgłoszono to dobry znak dojrzewającego ekosystemu.
Dla właściciela strony WordPress
Yoast integruje NLWeb w fazach — docelowo bez dodatkowego setupu dla użytkowników pluginu. Jeśli masz Yoasta i poprawne Schema.org, twoja strona zbliża się do NLWeb-compatible przy kolejnych aktualizacjach pluginu. Dla serwisów które chcą iść szybciej — biblioteka Microsoftu i dokumentacja na nlweb.dev.