Prompt API (Chrome)

Interfejs JavaScript w Chrome (window.ai od Chrome 127+) umożliwiający stronom WWW programatyczne korzystanie z lokalnego Gemini Nano — bez klucza API, bez chmury, bez kosztu inferencji. Pierwsza możliwość lokalnego LLM dostępnego dla strony WWW. Otwiera nowe wzorce projektowania pod prywatność i agent-readiness.

W Polsce nazywane też:

Prompt API Chromewindow.ai Chromelokalne API LLM ChromeJavaScript API Gemini Nano

Chrome ma na dysku użytkownika 4 GB modelu Gemini Nano. Pytanie: czy strona WWW odwiedzana przez tego użytkownika może z tego modelu korzystać?

Odpowiedź: tak. Przez Prompt API. Z poziomu kodu JavaScript twojej strony możesz wywołać lokalny model i dostać odpowiedź — bez konieczności wysyłania danych użytkownika do twojego (ani jakiegokolwiek) backendu.

To jest pierwszy przypadek w historii webu, w którym strona ma dostęp do LLM bez połączenia sieciowego. Konsekwencje są nieoczywiste.

Czym jest Prompt API (Chrome)

Prompt API to interfejs JavaScript w Chrome umożliwiający stronom WWW programatyczne korzystanie z lokalnego modelu Gemini Nano przez window.ai (od Chrome 127+) — z metodami createTextSession, prompt, promptStreaming — bez konieczności klucza API, bez połączenia z chmurą i bez kosztu inferencji dla autora strony.

Podstawowe użycie

if (’ai’ in window) {
const session = await window.ai.createTextSession();
const response = await session.prompt(„Streść tę stronę”);
console.log(response);
}

Stronowa kontrola, lokalna inferencja, zero kosztu serwerowego. Model używa pre-stage’owanego weights.bin w katalogu OptGuideOnDeviceModel.

Wymagania

Chrome 127+ (origin trial), 132+ (stabilne dla wybranych funkcji). Profil użytkownika musi mieć pobrany Gemini Nano (urządzenie spełnia wymagania sprzętowe, polityka GenAILocalFoundationalModelSettings nie blokuje, użytkownik włączył funkcje AI lub Chrome je włączył domyślnie).

W chrome://flags muszą być włączone: #prompt-api-for-gemini-nano i #optimization-guide-on-device-model (drugie zwykle Enabled BypassPerfRequirement dla deweloperów testujących na słabszym sprzęcie).

Implikacje dla budowania stron

Stronowy chat z asystentem AI bez backendu: AI Help w produktach Saas-owych bez kosztu inferencji. Forma kontaktowa która analizuje wiadomość przed wysłaniem (klasyfikacja sentymentu, wykrywanie spamu) lokalnie. Spersonalizowane rekomendacje produktów liczone na urządzeniu użytkownika bez wysyłania danych behawioralnych do serwera.

Edukacyjne strony z natychmiastową odpowiedzią na pytania o treść (NLWeb-like funkcjonalność bez NLWeb serwera).

Walidacja formularzy z semantyczną interpretacją — model rozumie czy treść w polu „opisz problem” jest sensowna, nie tylko czy nie jest pusta.

Implikacje dla prywatności

Plus: dane użytkownika wpisane do prompt’u nie opuszczają urządzenia. To jest fundamentalnie inny model prywatności niż wywołanie API OpenAI czy Anthropic.

Minus: jeśli strona przekazuje do modelu kontekst innych stron które użytkownik odwiedził (np. przez fingerprinting historii w localStorage), to jest cross-site context aggregation w sposób który nie wymaga uploadu do chmury.

Status prawny Prompt API z punktu widzenia RODO nie jest jeszcze rozstrzygnięty. Czy wywołanie lokalnego LLM przez stronę WWW jest „przetwarzaniem danych” w rozumieniu art. 4(2)? Czy strona staje się administratorem, czy procesorem, czy ani jednym ani drugim? Pierwsze regulacyjne testy tej kwestii spodziewane są w 2026-2027.

Prompt API a agent-readiness

Strona która sama używa Prompt API jest stroną która „ma AI w środku” — może odpowiadać agentom AI bardziej dynamicznie, klasyfikować ich intencje, generować odpowiedzi w czasie rzeczywistym.

Stronowe użycie Prompt API jest najbardziej oczywistym sposobem na agent-readiness zorientowane na Browser-as-Agent — strona która sama korzysta z modelu jest stroną która rozumie jak model myśli o jej treści.

Przeglądarka-jako-AgentParadygmat w którym przeglądarka zawiera wbudowany lokalny LLM modulujący doświadczenie każdej odwiedzanej strony — bez wyraźnej intencji użytkownika i bez wiedzy autora strony. W przeciwieństwie do Agent-in-Browser (świadomie uruchamiany gość), Browser-as-Agent jest cały czas obecny. Wcielenie: Chrome z Gemini Nano w 500M+ urządzeń.Gemini NanoLokalny LLM od Google z rodziny Gemini, przeznaczony do uruchomienia na urządzeniu użytkownika — napędzający funkcje AI w Chrome (Help me write, Page summarization, Tab group suggestions). Jedyne pełnoskalowe wcielenie Browser-as-Agent w 2026 — pre-stage'owany na ~500M+ urządzeń desktop bez zgody użytkownika.Pomóż mi napisać (Chrome)Funkcja Chrome wykorzystująca lokalny Gemini Nano do pomocy użytkownikowi w pisaniu treści w polach formularzy — z menu kontekstowego prawego kliknięcia. Model czyta kontekst strony (nagłówki, opis, FAQ) i generuje treść w stylu witryny. Wiadomości od klientów stają się generowane przez model, nie przez klienta.Podsumowywanie strony (Chrome)Funkcja Chrome wykorzystująca Gemini Nano do generowania 5-7 zdań podsumowania aktualnie otwartej strony — z menu kontekstowego, paska narzędzi i side panel'u. Podsumowanie staje się "twoją stroną" w głowie użytkownika. Jakość zależy od semantyki HTML, schema.org, hierarchii nagłówków i llms.txt.NLWebStandard Microsoftu ogłoszony na Build 2025 przez R.V. Guha — pozwala każdej stronie wystawiać konwersacyjny interfejs dla agentów AI przez endpointy /ask i /mcp, używając Schema.org jako bazy wiedzy. Każda instancja NLWeb jest też serwerem MCP.Gotowość agentowaZestaw cech strony internetowej decydujący o tym, czy agent AI potrafi ją skutecznie odczytać, zrozumieć i wykonać na niej działanie w imieniu użytkownika.