Grudzień 2023. Google ogłasza rodzinę modeli Gemini — Ultra, Pro, Nano. Pierwsze dwa są chmurowe, ostatni przeznaczony do uruchomienia lokalnie. W zapowiedzi: na Pixel 8 Pro, do funkcji typu auto-podsumowanie nagrania rozmowy.
Listopad 2024. Pierwsze raporty na forach społeczności Chrome: na komputerach pojawia się katalog OptGuideOnDeviceModel z plikiem weights.bin o rozmiarze ~4 GB.
Maj 2026. Sprawa staje się publiczna — Gemini Nano jest na ~500 milionach urządzeń desktop, niedostępny przez żaden widoczny przycisk w przeglądarce, ale aktywny w funkcjach AI Chrome.
Czym jest Gemini Nano
Gemini Nano to lokalny model językowy (LLM) od Google z rodziny Gemini przeznaczony do uruchomienia bezpośrednio na urządzeniu użytkownika — bez połączenia z chmurą — napędzający funkcje AI w Chrome (Help me write, Page summarization, Tab group suggestions, Smart paste) i będący jedynym pełnoskalowym wcieleniem paradygmatu Browser-as-Agent w 2026 roku.
Wymagania sprzętowe
Chrome profiluje urządzenie zanim zdecyduje o pobraniu modelu — odczytuje klasę CPU, klasę GPU, RAM, VRAM i przypisuje urządzeniu wewnętrzną „performance class” (klasa 6 jest dolnym progiem do otrzymania modelu). Typowo: ~16 GB RAM lub unified memory, GPU z odpowiednim VRAM, dysk z >22 GB wolnego miejsca w katalogu profilu Chrome.
Mechanizm profilowania pracuje przed wyświetleniem jakiegokolwiek UI ustawień AI — decyzja „push do tego użytkownika” jest podjęta automatycznie na podstawie odcisku palca sprzętowego.
Co dokładnie jest na dysku
W katalogu OptGuideOnDeviceModel/[wersja]/ (typowa wersja w maju 2026: 2025.8.8.1141):
weights.bin — ~4 GB. Wagi modelu w formacie binarnym.
adapter_cache.bin — dziesiątki MB. Skompilowany cache adapterów LoRA.
encoder_cache.bin — dziesiątki MB. Cache tokenizera.
_metadata/verified_contents.json — manifest CRX-3.
on_device_model_execution_config.pb — Protocol Buffers config. Konfiguracja runtime’u: parametry inferencji, polityki bezpieczeństwa modelu. Plik aktualizowany przez Google bez interakcji użytkownika.
Razem rejestrowane są też cztery dodatkowe modele klasyfikacyjne (cele 40, 49, 51, 59 w enumeracji Chrome) — pomocnicze modele text-safety i routingu promptów.
Co Nano robi z twoją stroną
Podsumowanie strony: użytkownik klika „Summarize this page” — Nano czyta DOM, generuje 5-7 zdań. To podsumowanie staje się „twoją stroną” w głowie użytkownika.
Help me write: użytkownik wypełnia formularz na twojej stronie, klika „pomóż mi napisać”, Nano czyta kontekst strony i generuje treść wysyłaną do ciebie. Twoja oferta przepuszczona przez filtr modelu zanim trafi z powrotem jako wiadomość od klienta.
Tab group suggestions: Nano czyta otwarte karty i grupuje je. Jeśli twoja strona usług kosmetycznych jest w grupie nazwanej „Salony kosmetyczne — Warszawa”, twoja marka znika w klastrze.
Relacja do AI Mode w Chrome
Pigułka „AI Mode” w pasku adresu Chrome NIE używa Gemini Nano. AI Mode to chmurowy Search Generative Experience od Google — każde zapytanie jedzie na serwer. To dwa różne flow w tej samej przeglądarce, łatwo mylić.
Lokalny Nano działa wyłącznie w funkcjach uruchamianych z menu kontekstowych formularzy i prawym kliknięciem.
Jak zablokować
Polityka enterprise GenAILocalFoundationalModelSettings ustawiona na 1 wyłącza pobieranie i usuwa istniejący model. Pełna instrukcja dla Windows, macOS i Linux: CyberFlux.