Gemma 197M

Ultra-efektywny model językowy Google (197M parametrów, ~200MB) ogłoszony na I/O 2026, wpinany w Chrome obok Gemini Nano jako drugi lokalny model przeglądarkowy. Zaprojektowany do zadań task-specific (summarizer, translator, classifier). Mała wielkość pozwala dystrybuować na urządzenia klasy budget.

W Polsce nazywane też:

Gemma 197MGemma 197ultra-efektywna Gemma

Najbardziej niedoceniana zapowiedź Google I/O 2026 nie była Gemini Omni ani Antigravity 2.0. Była ultra-efektywnym modelem 197 milionów parametrów, który Google wpina w Chrome obok Gemini Nano. Skala dystrybucji: potencjalnie wszystkie urządzenia z Chrome 148+.

Czym jest Gemma 197M

Gemma 197M to ultra-efektywny model językowy Google ogłoszony na I/O 2026, należący do serii Gemma (otwarte modele wagi Google) — z 197 milionami parametrów (~200MB rozmiaru), zaprojektowany do zadań task-specific takich jak summarizer, translator, classifier — wpinany w Chrome obok Gemini Nano jako drugi lokalny model przeglądarkowy. Mała wielkość pozwala uruchamiać go na urządzeniach, na które Gemini Nano (4GB) nie wchodzi.

Pozycja w stosie Chrome AI

Chrome 148, w którym Prompt API osiągnął stabilność, używa teraz dwóch modeli lokalnych:
– Gemini Nano (~4GB) — większy, wszechstronny, dla zadań wymagających głębszej generacji,
– Gemma 197M (~200MB) — mniejszy, task-specific, dla zadań typu summarization, classification, translation.

Wybór modelu jest automatyczny po stronie Chrome. Developer wywołujący Prompt API nie wybiera modelu — Chrome decyduje na podstawie zadania i dostępnych zasobów urządzenia.

Co Gemma 197M zmienia w dystrybucji AI

Gemini Nano wymagał urządzeń klasy desktop/wysoki Android (4GB+ RAM, GPU z odpowiednią obsługą). Wpis „14 minut 28 sekund zero kliknięć użytkownika” z 22 maja 2026 na cyberflux.pl opisuje, jak Chrome dystrybuuje Gemini Nano automatycznie do katalogu OptGuideOnDeviceModel.

Z Gemma 197M skala dystrybucji rośnie. Model 200MB mieści się na urządzeniach klasy budget, starszych telefonach, niskobudżetowych laptopach. Google nie potwierdził jeszcze, czy mechanizm dystrybucji jest ten sam (silent download przez Optimization Guide), ale architektura sugeruje, że tak.

Pytania otwarte (saga weights.bin, ciąg dalszy)

Po wpisie na cyberflux.pl o silent download Gemini Nano, Gemma 197M otwiera kilka pytań:

1. Czy polityka GenAILocalFoundationalModelSettings, blokująca pobieranie Gemini Nano, obejmuje też Gemma 197M? Czy administratorzy enterprise mogą wciąż blokować silent download?

2. Czy Gemma 197M jest dystrybuowana tym samym mechanizmem CRX-3 + Optimization Guide? Czy w katalogu OptGuideOnDeviceModel pojawia się drugi plik weights.bin?

3. Co z prawem ePrivacy (art. 5(3)) — zgoda na pobieranie i przechowywanie informacji w urządzeniu użytkownika — kiedy Chrome pobiera trzeci, czwarty model bez oddzielnej zgody?

Te pytania będą tematem osobnego wpisu na cyberflux.pl w hubie Google I/O 2026.

Dla deweloperów

Gemma 197M nie jest dostępna jako osobne API. Developer wywołuje standardowe API Chrome (Prompt API, Summarizer API, Translator API) — a Chrome wybiera model. Dla developera oznacza to:

– features summarization mogą być wdrażane dla szerszej grupy urządzeń niż wcześniej,
– specific narrow tasks (klasyfikacja sentymentu, detekcja języka) mogą być rozwiązane przez Gemma 197M zamiast wysyłania zapytania na serwer,
– koszty inferencji spadają do zera dla zadań mieszczących się w Gemma 197M.

Powiązane pojęcia

Gemini 3.5 FlashFlagowy model językowy ogłoszony na Google I/O 2026 (19 maja), GA 21 maja. Czterokrotnie szybszy niż dotychczasowe frontier modele, zoptymalizowany pod agentic coding, long-horizon tasks i real-world workflows. Silnik Antigravity 2.0, Auto Browse, Gemini Spark.Gemini OmniSeria multimodalnych modeli Google ogłoszona na I/O 2026, pierwsza wersja Gemini Omni Flash. Przyjmuje dowolny typ wejścia (tekst, obraz, audio, wideo) i generuje dowolny typ wyjścia. Symetryczna multimodalność. Krok w stronę AGI według Hassabisa. Rozszerza Pierwszego Czytelnika z tekstu na wszystkie media.Przeglądarka-jako-AgentParadygmat w którym przeglądarka zawiera wbudowany lokalny LLM modulujący doświadczenie każdej odwiedzanej strony — bez wyraźnej intencji użytkownika i bez wiedzy autora strony. W przeciwieństwie do Agent-in-Browser (świadomie uruchamiany gość), Browser-as-Agent jest cały czas obecny. Wcielenie: Chrome z Gemini Nano w 500M+ urządzeń.Gemini NanoLokalny LLM od Google z rodziny Gemini, przeznaczony do uruchomienia na urządzeniu użytkownika — napędzający funkcje AI w Chrome (Help me write, Page summarization, Tab group suggestions). Jedyne pełnoskalowe wcielenie Browser-as-Agent w 2026 — pre-stage'owany na ~500M+ urządzeń desktop bez zgody użytkownika.Katalog modelu na urządzeniu (Chrome)Nazwa katalogu w profilu Chrome zawierającego wagi Gemini Nano (~4 GB w weights.bin) — wewnętrzny skrót od "Optimization Guide On Device Model" wybrany zamiast nazwy "GeminiNano", co utrudnia użytkownikowi powiązanie artefaktu z marką i kategorią produktu. Przykład scope inflation through generic naming.Ciche wdrożenie AI po stronie klientaWzorzec dystrybucji w którym vendor automatycznie umieszcza komponenty AI (modele, mosty, runtime'y) na urządzeniu użytkownika bez zgody, z automatycznym przywracaniem po usunięciu — wykorzystując kanały aktualizacji jako warstwę dostarczenia AI. Wcielenia: Chrome z Gemini Nano (4 GB), Anthropic Claude Desktop z Native Messaging bridge.