Najbardziej niedoceniana zapowiedź Google I/O 2026 nie była Gemini Omni ani Antigravity 2.0. Była ultra-efektywnym modelem 197 milionów parametrów, który Google wpina w Chrome obok Gemini Nano. Skala dystrybucji: potencjalnie wszystkie urządzenia z Chrome 148+.
Czym jest Gemma 197M
Gemma 197M to ultra-efektywny model językowy Google ogłoszony na I/O 2026, należący do serii Gemma (otwarte modele wagi Google) — z 197 milionami parametrów (~200MB rozmiaru), zaprojektowany do zadań task-specific takich jak summarizer, translator, classifier — wpinany w Chrome obok Gemini Nano jako drugi lokalny model przeglądarkowy. Mała wielkość pozwala uruchamiać go na urządzeniach, na które Gemini Nano (4GB) nie wchodzi.
Pozycja w stosie Chrome AI
Chrome 148, w którym Prompt API osiągnął stabilność, używa teraz dwóch modeli lokalnych:
– Gemini Nano (~4GB) — większy, wszechstronny, dla zadań wymagających głębszej generacji,
– Gemma 197M (~200MB) — mniejszy, task-specific, dla zadań typu summarization, classification, translation.
Wybór modelu jest automatyczny po stronie Chrome. Developer wywołujący Prompt API nie wybiera modelu — Chrome decyduje na podstawie zadania i dostępnych zasobów urządzenia.
Co Gemma 197M zmienia w dystrybucji AI
Gemini Nano wymagał urządzeń klasy desktop/wysoki Android (4GB+ RAM, GPU z odpowiednią obsługą). Wpis „14 minut 28 sekund zero kliknięć użytkownika” z 22 maja 2026 na cyberflux.pl opisuje, jak Chrome dystrybuuje Gemini Nano automatycznie do katalogu OptGuideOnDeviceModel.
Z Gemma 197M skala dystrybucji rośnie. Model 200MB mieści się na urządzeniach klasy budget, starszych telefonach, niskobudżetowych laptopach. Google nie potwierdził jeszcze, czy mechanizm dystrybucji jest ten sam (silent download przez Optimization Guide), ale architektura sugeruje, że tak.
Pytania otwarte (saga weights.bin, ciąg dalszy)
Po wpisie na cyberflux.pl o silent download Gemini Nano, Gemma 197M otwiera kilka pytań:
1. Czy polityka GenAILocalFoundationalModelSettings, blokująca pobieranie Gemini Nano, obejmuje też Gemma 197M? Czy administratorzy enterprise mogą wciąż blokować silent download?
2. Czy Gemma 197M jest dystrybuowana tym samym mechanizmem CRX-3 + Optimization Guide? Czy w katalogu OptGuideOnDeviceModel pojawia się drugi plik weights.bin?
3. Co z prawem ePrivacy (art. 5(3)) — zgoda na pobieranie i przechowywanie informacji w urządzeniu użytkownika — kiedy Chrome pobiera trzeci, czwarty model bez oddzielnej zgody?
Te pytania będą tematem osobnego wpisu na cyberflux.pl w hubie Google I/O 2026.
Dla deweloperów
Gemma 197M nie jest dostępna jako osobne API. Developer wywołuje standardowe API Chrome (Prompt API, Summarizer API, Translator API) — a Chrome wybiera model. Dla developera oznacza to:
– features summarization mogą być wdrażane dla szerszej grupy urządzeń niż wcześniej,
– specific narrow tasks (klasyfikacja sentymentu, detekcja języka) mogą być rozwiązane przez Gemma 197M zamiast wysyłania zapytania na serwer,
– koszty inferencji spadają do zera dla zadań mieszczących się w Gemma 197M.