Przed erą foundation models każdy system AI był budowany od zera dla konkretnego zadania. System rozpoznający spam w emailach był osobnym projektem od systemu tłumaczącego teksty, który był osobnym projektem od systemu generującego opisy produktów. Tygodnie danych, tygodnie trenowania, wyspecjalizowany model który robi jedno zadanie.
Foundation model zmienił tę logikę fundamentalnie. Jeden model trenowany na miliardach dokumentów na koszt setek milionów dolarów — który potem może być adaptowany do tysięcy różnych zadań przez fine-tuning lub prompting. Zamiast budować od zera, adaptujesz fundament.
Czym jest foundation model
Foundation model to duży model AI trenowany na ogromnych zbiorach danych (tekst, obraz, kod, audio) który służy jako „fundament” dla szerokiego zakresu zastosowań — przez fine-tuning na specyficzne zadania, przez prompting bez dodatkowego trenowania, lub jako komponent w większych systemach agentowych. GPT-4o, Claude, Gemini, Llama są foundation models.
Dwie ścieżki adaptacji
Prompting (zero/few-shot): foundation model jest używany bezpośrednio przez odpowiednio sformułowany prompt. Nie wymaga dodatkowego trenowania. Wystarczy dla większości zastosowań gdzie model już „wie” jak wykonać zadanie.
Fine-tuning: foundation model jest dalej trenowany na małym zbiorze danych specyficznych dla zadania. Efekt: model który „zna” domenę lepiej niż wynikałoby z ogólnego treningu. Wymagane gdy zadanie jest bardzo specyficzne (branżowa terminologia, specyficzny format wyjścia) lub gdy prompting nie daje wystarczającej jakości.
Foundation model jako infrastruktura
Foundation models są infrastrukturą AI — podobnie jak chmura obliczeniowa jest infrastrukturą IT. Firma nie buduje własnej chmury — korzysta z AWS/Azure/GCP. Firma nie trenuje własnego foundation model — korzysta z GPT/Claude/Gemini lub open-source Llama/Mistral.
Wyjątki istnieją dla gigantów technologicznych (Google, Meta, Microsoft, Amazon), firm z unikalną wiedzą domenową i bardzo dużymi zbiorami danych (Bloomberg, Adobe, Salesforce mają własne modele), i rządów/instytucji z wymaganiami suwerenności (własne modele dla bezpieczeństwa).
General Purpose AI (GPAI) w AI Act
AI Act UE definiuje „General Purpose AI model” jako foundation model — model trenowany na dużych zbiorach danych który może być używany do wielu celów. Dostawcy GPAI (OpenAI, Anthropic, Google, Meta) mają specyficzne obowiązki w AI Act dotyczące dokumentacji, oceny ryzyka i transparentności możliwości modelu.