Chrome ma na dysku użytkownika 4 GB modelu Gemini Nano. Pytanie: czy strona WWW odwiedzana przez tego użytkownika może z tego modelu korzystać?
Odpowiedź: tak. Przez Prompt API. Z poziomu kodu JavaScript twojej strony możesz wywołać lokalny model i dostać odpowiedź — bez konieczności wysyłania danych użytkownika do twojego (ani jakiegokolwiek) backendu.
To jest pierwszy przypadek w historii webu, w którym strona ma dostęp do LLM bez połączenia sieciowego. Konsekwencje są nieoczywiste.
Czym jest Prompt API (Chrome)
Prompt API to interfejs JavaScript w Chrome umożliwiający stronom WWW programatyczne korzystanie z lokalnego modelu Gemini Nano przez window.ai (od Chrome 127+) — z metodami createTextSession, prompt, promptStreaming — bez konieczności klucza API, bez połączenia z chmurą i bez kosztu inferencji dla autora strony.
Podstawowe użycie
if (’ai’ in window) {
const session = await window.ai.createTextSession();
const response = await session.prompt(„Streść tę stronę”);
console.log(response);
}
Stronowa kontrola, lokalna inferencja, zero kosztu serwerowego. Model używa pre-stage’owanego weights.bin w katalogu OptGuideOnDeviceModel.
Wymagania
Chrome 127+ (origin trial), 132+ (stabilne dla wybranych funkcji). Profil użytkownika musi mieć pobrany Gemini Nano (urządzenie spełnia wymagania sprzętowe, polityka GenAILocalFoundationalModelSettings nie blokuje, użytkownik włączył funkcje AI lub Chrome je włączył domyślnie).
W chrome://flags muszą być włączone: #prompt-api-for-gemini-nano i #optimization-guide-on-device-model (drugie zwykle Enabled BypassPerfRequirement dla deweloperów testujących na słabszym sprzęcie).
Implikacje dla budowania stron
Stronowy chat z asystentem AI bez backendu: AI Help w produktach Saas-owych bez kosztu inferencji. Forma kontaktowa która analizuje wiadomość przed wysłaniem (klasyfikacja sentymentu, wykrywanie spamu) lokalnie. Spersonalizowane rekomendacje produktów liczone na urządzeniu użytkownika bez wysyłania danych behawioralnych do serwera.
Edukacyjne strony z natychmiastową odpowiedzią na pytania o treść (NLWeb-like funkcjonalność bez NLWeb serwera).
Walidacja formularzy z semantyczną interpretacją — model rozumie czy treść w polu „opisz problem” jest sensowna, nie tylko czy nie jest pusta.
Implikacje dla prywatności
Plus: dane użytkownika wpisane do prompt’u nie opuszczają urządzenia. To jest fundamentalnie inny model prywatności niż wywołanie API OpenAI czy Anthropic.
Minus: jeśli strona przekazuje do modelu kontekst innych stron które użytkownik odwiedził (np. przez fingerprinting historii w localStorage), to jest cross-site context aggregation w sposób który nie wymaga uploadu do chmury.
Status prawny Prompt API z punktu widzenia RODO nie jest jeszcze rozstrzygnięty. Czy wywołanie lokalnego LLM przez stronę WWW jest „przetwarzaniem danych” w rozumieniu art. 4(2)? Czy strona staje się administratorem, czy procesorem, czy ani jednym ani drugim? Pierwsze regulacyjne testy tej kwestii spodziewane są w 2026-2027.
Prompt API a agent-readiness
Strona która sama używa Prompt API jest stroną która „ma AI w środku” — może odpowiadać agentom AI bardziej dynamicznie, klasyfikować ich intencje, generować odpowiedzi w czasie rzeczywistym.
Stronowe użycie Prompt API jest najbardziej oczywistym sposobem na agent-readiness zorientowane na Browser-as-Agent — strona która sama korzysta z modelu jest stroną która rozumie jak model myśli o jej treści.