Model bazowy

Duży model AI trenowany na ogromnych zbiorach danych służący jako fundament dla szerokiego zakresu zastosowań — przez fine-tuning lub prompting. GPT-4o, Claude, Gemini, Llama to foundation models. AI Act definiuje je jako GPAI z konkretnymi obowiązkami dla dostawców.

W Polsce nazywane też:

model bazowyfoundation modelmodel fundamentowyGPAIduży model językowy

Przed erą foundation models każdy system AI był budowany od zera dla konkretnego zadania. System rozpoznający spam w emailach był osobnym projektem od systemu tłumaczącego teksty, który był osobnym projektem od systemu generującego opisy produktów. Tygodnie danych, tygodnie trenowania, wyspecjalizowany model który robi jedno zadanie.

Foundation model zmienił tę logikę fundamentalnie. Jeden model trenowany na miliardach dokumentów na koszt setek milionów dolarów — który potem może być adaptowany do tysięcy różnych zadań przez fine-tuning lub prompting. Zamiast budować od zera, adaptujesz fundament.

Czym jest foundation model

Foundation model to duży model AI trenowany na ogromnych zbiorach danych (tekst, obraz, kod, audio) który służy jako „fundament” dla szerokiego zakresu zastosowań — przez fine-tuning na specyficzne zadania, przez prompting bez dodatkowego trenowania, lub jako komponent w większych systemach agentowych. GPT-4o, Claude, Gemini, Llama są foundation models.

Dwie ścieżki adaptacji

Prompting (zero/few-shot): foundation model jest używany bezpośrednio przez odpowiednio sformułowany prompt. Nie wymaga dodatkowego trenowania. Wystarczy dla większości zastosowań gdzie model już „wie” jak wykonać zadanie.

Fine-tuning: foundation model jest dalej trenowany na małym zbiorze danych specyficznych dla zadania. Efekt: model który „zna” domenę lepiej niż wynikałoby z ogólnego treningu. Wymagane gdy zadanie jest bardzo specyficzne (branżowa terminologia, specyficzny format wyjścia) lub gdy prompting nie daje wystarczającej jakości.

Foundation model jako infrastruktura

Foundation models są infrastrukturą AI — podobnie jak chmura obliczeniowa jest infrastrukturą IT. Firma nie buduje własnej chmury — korzysta z AWS/Azure/GCP. Firma nie trenuje własnego foundation model — korzysta z GPT/Claude/Gemini lub open-source Llama/Mistral.

Wyjątki istnieją dla gigantów technologicznych (Google, Meta, Microsoft, Amazon), firm z unikalną wiedzą domenową i bardzo dużymi zbiorami danych (Bloomberg, Adobe, Salesforce mają własne modele), i rządów/instytucji z wymaganiami suwerenności (własne modele dla bezpieczeństwa).

General Purpose AI (GPAI) w AI Act

AI Act UE definiuje „General Purpose AI model” jako foundation model — model trenowany na dużych zbiorach danych który może być używany do wielu celów. Dostawcy GPAI (OpenAI, Anthropic, Google, Meta) mają specyficzne obowiązki w AI Act dotyczące dokumentacji, oceny ryzyka i transparentności możliwości modelu.

Powiązane pojęcia

AI Act UE dla agentówWymagania unijnego AI Act (EU 2024/1689) stosowane do systemów agentowych — klasyfikacja według ryzyka (minimalny do niedopuszczalnego), obowiązki dokumentacji i nadzoru dla wysokiego ryzyka, rejestracja od marca 2026. Agent w rekrutacji, kredytach lub diagnostyce = wysokie ryzyko z rygorystycznymi wymaganiami.ClaudeRodzina modeli językowych Anthropic — Haiku, Sonnet, Opus — projektowana z priorytetem bezpieczeństwa przez Constitutional AI. Wyróżniki: 200K tokenów okno kontekstu, natywna obsługa MCP, extended thinking w Claude 3.7+. Fundament słownika Webflux.Dostrajanie modeluDostosowanie pretrenowanego modelu językowego do specyficznej domeny przez dodatkowe trenowanie — modyfikuje jak model się zachowuje (styl, format, terminologia). Fine-tuning = jak model odpowiada. RAG = co model wie. Dla większości enterprise: zacznij od RAG + prompt engineering.GPT-4oFlagowy model OpenAI (maj 2024) — multimodalny system natywnie przetwarzający tekst, obraz i audio w jednym modelu, z wydajnością GPT-4 Turbo przy 2x niższych kosztach. Fundament ChatGPT i OpenAI API. "o" = "omni" — jedna sieć neuronowa dla wszystkich modalności.LlamaOpen-source modele językowe Meta — od 1B do 405B parametrów — dostępne do pobrania i uruchamiania lokalnie bez opłat za API. Fundament ekosystemu self-hosted AI i podstawa setek fine-tunedowanych modeli. Llama 3.3 70B = jakość GPT-4o przy self-hosting.Agent hostowany lokalnieAgent AI działający na infrastrukturze organizacji bez zewnętrznych wywołań API — model wdrożony lokalnie lub w prywatnej chmurze, dane nigdy nie opuszczają organizacji. Kluczowe dla regulowanych branż i danych wrażliwych. Llama, Mistral, Phi jako popularne modele open-source.