NLWeb

Standard Microsoftu ogłoszony na Build 2025 przez R.V. Guha — pozwala każdej stronie wystawiać konwersacyjny interfejs dla agentów AI przez endpointy /ask i /mcp, używając Schema.org jako bazy wiedzy. Każda instancja NLWeb jest też serwerem MCP.

W Polsce nazywane też:

konwersacyjny interfejs stronystrona jako chatbotendpoint ask

R.V. Guha stworzył RSS w 1999 — format który pozwolił każdemu serwisowi publikować treść w ustandaryzowany sposób czytelny dla maszyn. Stworzył RDF i stał za Schema.org — fundamentem danych strukturalnych których używa dziś każda strona która chce być rozumiana przez Google i agentów AI. Jeśli ktoś rozumie jak sprawić żeby internet był czytelny dla maszyn, to on.

W maju 2025, jako Technical Fellow w Microsofcie, Guha ogłosił NLWeb na Build 2025. Microsoft porównał to do HTML: „tak jak HTML ułatwił każdemu tworzenie strony, NLWeb ułatwia każdemu tworzenie konwersacyjnego interfejsu dla AI”.

Czym jest NLWeb

NLWeb to otwarty standard Microsoftu ogłoszony na Build 2025 — pozwala każdej stronie internetowej wystawiać konwersacyjny interfejs dla agentów AI przez dwa endpointy: /ask dla zapytań w języku naturalnym i /mcp dla komunikacji agent-agent, używając Schema.org jako bazy wiedzy. Microsoft powiedział wprost: każda instancja NLWeb jest też serwerem MCP.

Dwa endpointy — dwa sposoby rozmowy

/ask przyjmuje pytanie w języku naturalnym i zwraca ustrukturyzowaną odpowiedź JSON opartą na danych Schema.org strony. Agent pyta „jakie masz produkty dla firm poniżej 50 pracowników?” i dostaje gotową odpowiedź — nie link do strony kategorii który musi sparsować.

/mcp wystawia te same możliwości przez protokół MCP — agent-to-agent, maszyna do maszyny, bez warstwy języka naturalnego. To jest punkt wejścia dla agentów które nie potrzebują interpretacji — wiedzą co chcą, wywołują narzędzie.

Schema.org jako baza wiedzy

NLWeb nie wymaga nowej bazy danych ani osobnego indeksu treści. Używa danych Schema.org które strona już ma — produkty, artykuły, organizacje, FAQ. To co Yoast generuje dla Google, NLWeb przekształca w interfejs konwersacyjny dla agentów.

To jest właśnie czemu Yoast ogłosił współpracę z Microsoftem w listopadzie 2025. Mają Schema.org na milionach stron WordPress. NLWeb to warstwa którą mogą dodać na wierzch bez przebudowy — Yoast zbiera Schema.org od lat, Microsoft dostarcza protokół który tę wiedzę udostępnia agentom.

NLWeb vs samodzielna implementacja /ask

Microsoft udostępnił bibliotekę Python która robi ciężką robotę — RAG oparty na Schema.org, obsługa endpointów, integracja z wybranym modelem AI. Można też zbudować własny endpoint /ask zasilony llms-full.txt lub własną bazą wiedzy przekazaną przez Claude API. Efekt funkcjonalnie podobny, różna implementacja.

Różnica jest w semantyce danych: NLWeb zakłada Schema.org jako warstwę znaczenia. Własna implementacja z llms-full.txt jest prostsza wdrożeniowo, ale brakuje jej precyzji strukturalnej którą Schema.org wnosi.

Adopcja i bezpieczeństwo

Shopify, Snowflake, TripAdvisor, Eventbrite i Hearst budują na NLWeb — to production deployments, nie prototypy. Security researchers Aonan Guan i Lei Wang znaleźli podatność krótko po premierze. Microsoft załatał ją 1 lipca 2025, nie przypisując CVE — co badacze krytykowali. Fakt że podatność znaleziono szybko i publicznie zgłoszono to dobry znak dojrzewającego ekosystemu.

Dla właściciela strony WordPress

Yoast integruje NLWeb w fazach — docelowo bez dodatkowego setupu dla użytkowników pluginu. Jeśli masz Yoasta i poprawne Schema.org, twoja strona zbliża się do NLWeb-compatible przy kolejnych aktualizacjach pluginu. Dla serwisów które chcą iść szybciej — biblioteka Microsoftu i dokumentacja na nlweb.dev.

Powiązane pojęcia

Protokół kontekstu modeluOtwarty standard Anthropic umożliwiający agentom AI łączenie się z zewnętrznymi narzędziami, bazami danych i API w ustandaryzowany sposób — jak USB dla modeli językowych.Gotowość agentowaZestaw cech strony internetowej decydujący o tym, czy agent AI potrafi ją skutecznie odczytać, zrozumieć i wykonać na niej działanie w imieniu użytkownika.Dane strukturalneUstandaryzowany sposób opisywania treści strony w formacie zrozumiałym dla maszyn — używany przez wyszukiwarki do rich snippets i przez agentów AI do rozumienia kontekstu strony.llms.txtPlik tekstowy umieszczany w katalogu głównym strony zawierający uproszczone informacje o witrynie przeznaczone dla modeli językowych — analogia robots.txt ale dla LLM.