Klasyczny model wdrażania funkcjonalności: użytkownik klika „włącz”, aplikacja pobiera potrzebne komponenty, użytkownik korzysta. Zasób przychodzi kiedy jest potrzebny. Just-in-time.
Klasyczny model wdrażania modeli AI w przeglądarce — Gemini Nano w Chrome — odwraca to: zasób przychodzi na wszelki wypadek. Just-in-case.
Czym jest Pre-staged AI Capability
Pre-staged AI Capability to wzorzec architektoniczny w którym komponent AI (model, weights, runtime) jest pobierany i instalowany na urządzeniu użytkownika zanim użytkownik wywoła jakąkolwiek funkcję której ten komponent jest potrzebny — z założeniem że jeśli funkcja kiedykolwiek zostanie wywołana, zasób będzie dostępny natychmiast i bez opóźnienia sieciowego.
Logika wzorca
Pre-staging optymalizuje pod jeden konkretny scenariusz: użytkownik pierwszy raz klika funkcję AI w przeglądarce i oczekuje natychmiastowej odpowiedzi. Bez pre-stagingu pierwsze użycie wymaga pobrania ~4 GB modelu, co trwa kilkanaście minut na typowym łączu. Z pre-stagingiem — model jest, użytkownik dostaje odpowiedź w sekundę.
Z perspektywy vendora to ma sens: lepsze pierwsze wrażenie z funkcji AI = większa adopcja funkcji = lepsze metryki produktowe.
Z perspektywy użytkownika: koszt jest na nim. 4 GB dysku, koszt transferu (potencjalnie metered), embodied carbon SSD-ka który mógłby pomieścić dane użytkownika.
Mismatch między kosztem a użyciem
Hanff udokumentował: 14 minut 28 sekund instalacji modelu na świeżym profilu Chrome z zero kliknięciami użytkownika. Profile prowadzony przez DevTools Protocol, zero interakcji z UI AI, model i tak wylądował na dysku.
Większość użytkowników którzy mają na dysku Gemini Nano nigdy nie wywoła funkcji która go potrzebuje. Help me write, Page summarization, Smart paste — to są funkcje z niską adopcją w przeciętnej populacji Chrome.
Pre-stage’owana zdolność istnieje „na zapas” dla wszystkich, korzysta z niej mniejszość. Koszt rozkłada się na wszystkich.
Future-options resource
Z perspektywy vendora pre-staged AI capability jest też future-options resource — zasobem, który Google ma rozłożony na urządzeniach na wypadek, gdyby w przyszłości chciał z niego skorzystać dla nowych funkcji. Model na dysku można wykorzystać dla funkcji która jeszcze nie istnieje, bez konieczności drugiej fali pobierania.
To pozycjonuje Google bliżej użytkownika niż jakikolwiek inny gracz AI. Treść stron, marki, kompozycje przechodzą przez Gemini Nano zanim trafią do oczu użytkownika — i to bez świadomej decyzji ze strony użytkownika i bez świadomej decyzji ze strony autora.
Implikacje dla Agentic Web
Pre-staged AI Capability jest fundamentem architektonicznym Browser-as-Agent. Browser może być stale obecny jako agent tylko dlatego że ma pre-stage’owany model. Bez pre-stagingu Browser-as-Agent musiałby działać przez zdalne API — co z definicji zamieniłoby go z lokalnego paradygmatu w wariant Agent-in-Browser z dodatkowym serwerowym hop.
Pre-staging to mechanizm, który czyni Browser-as-Agent technicznie i ekonomicznie wykonalnym jako masowy paradygmat.