Gemini Nano

Lokalny LLM od Google z rodziny Gemini, przeznaczony do uruchomienia na urządzeniu użytkownika — napędzający funkcje AI w Chrome (Help me write, Page summarization, Tab group suggestions). Jedyne pełnoskalowe wcielenie Browser-as-Agent w 2026 — pre-stage'owany na ~500M+ urządzeń desktop bez zgody użytkownika.

W Polsce nazywane też:

Gemini Nanolokalny model Googlelokalny LLM w Chromeon-device GeminiChrome AI model

Grudzień 2023. Google ogłasza rodzinę modeli Gemini — Ultra, Pro, Nano. Pierwsze dwa są chmurowe, ostatni przeznaczony do uruchomienia lokalnie. W zapowiedzi: na Pixel 8 Pro, do funkcji typu auto-podsumowanie nagrania rozmowy.

Listopad 2024. Pierwsze raporty na forach społeczności Chrome: na komputerach pojawia się katalog OptGuideOnDeviceModel z plikiem weights.bin o rozmiarze ~4 GB.

Maj 2026. Sprawa staje się publiczna — Gemini Nano jest na ~500 milionach urządzeń desktop, niedostępny przez żaden widoczny przycisk w przeglądarce, ale aktywny w funkcjach AI Chrome.

Czym jest Gemini Nano

Gemini Nano to lokalny model językowy (LLM) od Google z rodziny Gemini przeznaczony do uruchomienia bezpośrednio na urządzeniu użytkownika — bez połączenia z chmurą — napędzający funkcje AI w Chrome (Help me write, Page summarization, Tab group suggestions, Smart paste) i będący jedynym pełnoskalowym wcieleniem paradygmatu Browser-as-Agent w 2026 roku.

Wymagania sprzętowe

Chrome profiluje urządzenie zanim zdecyduje o pobraniu modelu — odczytuje klasę CPU, klasę GPU, RAM, VRAM i przypisuje urządzeniu wewnętrzną „performance class” (klasa 6 jest dolnym progiem do otrzymania modelu). Typowo: ~16 GB RAM lub unified memory, GPU z odpowiednim VRAM, dysk z >22 GB wolnego miejsca w katalogu profilu Chrome.

Mechanizm profilowania pracuje przed wyświetleniem jakiegokolwiek UI ustawień AI — decyzja „push do tego użytkownika” jest podjęta automatycznie na podstawie odcisku palca sprzętowego.

Co dokładnie jest na dysku

W katalogu OptGuideOnDeviceModel/[wersja]/ (typowa wersja w maju 2026: 2025.8.8.1141):

weights.bin — ~4 GB. Wagi modelu w formacie binarnym.
adapter_cache.bin — dziesiątki MB. Skompilowany cache adapterów LoRA.
encoder_cache.bin — dziesiątki MB. Cache tokenizera.
_metadata/verified_contents.json — manifest CRX-3.
on_device_model_execution_config.pb — Protocol Buffers config. Konfiguracja runtime’u: parametry inferencji, polityki bezpieczeństwa modelu. Plik aktualizowany przez Google bez interakcji użytkownika.

Razem rejestrowane są też cztery dodatkowe modele klasyfikacyjne (cele 40, 49, 51, 59 w enumeracji Chrome) — pomocnicze modele text-safety i routingu promptów.

Co Nano robi z twoją stroną

Podsumowanie strony: użytkownik klika „Summarize this page” — Nano czyta DOM, generuje 5-7 zdań. To podsumowanie staje się „twoją stroną” w głowie użytkownika.

Help me write: użytkownik wypełnia formularz na twojej stronie, klika „pomóż mi napisać”, Nano czyta kontekst strony i generuje treść wysyłaną do ciebie. Twoja oferta przepuszczona przez filtr modelu zanim trafi z powrotem jako wiadomość od klienta.

Tab group suggestions: Nano czyta otwarte karty i grupuje je. Jeśli twoja strona usług kosmetycznych jest w grupie nazwanej „Salony kosmetyczne — Warszawa”, twoja marka znika w klastrze.

Relacja do AI Mode w Chrome

Pigułka „AI Mode” w pasku adresu Chrome NIE używa Gemini Nano. AI Mode to chmurowy Search Generative Experience od Google — każde zapytanie jedzie na serwer. To dwa różne flow w tej samej przeglądarce, łatwo mylić.

Lokalny Nano działa wyłącznie w funkcjach uruchamianych z menu kontekstowych formularzy i prawym kliknięciem.

Jak zablokować

Polityka enterprise GenAILocalFoundationalModelSettings ustawiona na 1 wyłącza pobieranie i usuwa istniejący model. Pełna instrukcja dla Windows, macOS i Linux: CyberFlux.

Tryb AI w ChromeChmurowy interfejs Search Generative Experience od Google wyświetlany jako "pigułka" w pasku adresu Chrome 147+. Każde zapytanie idzie na serwery Google. NIE używa lokalnego Gemini Nano — mimo wizualnej bliskości to dwa zupełnie różne flow. Etykieta sugeruje lokalność, której nie ma — przykład deceptive design pattern (EDPB 03/2022).Przeglądarka-jako-AgentParadygmat w którym przeglądarka zawiera wbudowany lokalny LLM modulujący doświadczenie każdej odwiedzanej strony — bez wyraźnej intencji użytkownika i bez wiedzy autora strony. W przeciwieństwie do Agent-in-Browser (świadomie uruchamiany gość), Browser-as-Agent jest cały czas obecny. Wcielenie: Chrome z Gemini Nano w 500M+ urządzeń.Chrome Optimization GuideKomponent Chromium odpowiedzialny za pobieranie i zarządzanie modelami ML w Chrome — od list bezpieczeństwa po lokalne LLM. Wykorzystuje Component Updater Chrome do dostarczania paczek CRX-3 z CDN edgedl.me.gvt1.com. Mechanizm który niegdyś pobierał setki KB, dziś pobiera 4 GB LLM tym samym kanałem.Polityka lokalnych modeli GenAI w ChromePolityka enterprise Google Chrome konfigurująca czy przeglądarka pobiera lokalne foundational models (Gemini Nano). Wartość 1 wyłącza pobieranie i usuwa istniejący model. Dostępna na Windows (rejestr), macOS (plist) i Linux (JSON). Pierwsza linia obrony przed silent client-side AI deployment.Pomóż mi napisać (Chrome)Funkcja Chrome wykorzystująca lokalny Gemini Nano do pomocy użytkownikowi w pisaniu treści w polach formularzy — z menu kontekstowego prawego kliknięcia. Model czyta kontekst strony (nagłówki, opis, FAQ) i generuje treść w stylu witryny. Wiadomości od klientów stają się generowane przez model, nie przez klienta.Katalog modelu na urządzeniu (Chrome)Nazwa katalogu w profilu Chrome zawierającego wagi Gemini Nano (~4 GB w weights.bin) — wewnętrzny skrót od "Optimization Guide On Device Model" wybrany zamiast nazwy "GeminiNano", co utrudnia użytkownikowi powiązanie artefaktu z marką i kategorią produktu. Przykład scope inflation through generic naming.Podsumowywanie strony (Chrome)Funkcja Chrome wykorzystująca Gemini Nano do generowania 5-7 zdań podsumowania aktualnie otwartej strony — z menu kontekstowego, paska narzędzi i side panel'u. Podsumowanie staje się "twoją stroną" w głowie użytkownika. Jakość zależy od semantyki HTML, schema.org, hierarchii nagłówków i llms.txt.Pre-stage'owana zdolność AIWzorzec architektoniczny w którym komponent AI (model, weights, runtime) jest pobierany na urządzenie użytkownika ZANIM użytkownik wywoła jakąkolwiek funkcję AI — żeby pierwsze użycie było natychmiastowe. Just-in-case zamiast just-in-time. Koszt na użytkowniku, korzyść głównie u vendora. Fundament Browser-as-Agent.