Luty 2023. Meta publikuje LLaMA — Large Language Model Meta AI — i jako pierwszy duży gracz udostępnia wagi modelu publicznie. Nie jako API. Jako pliki które można pobrać i uruchomić lokalnie.
Reakcja społeczności była natychmiastowa i bezprecedensowa. W ciągu tygodni: fine-tuned wersje, qunatized wersje do uruchomienia na laptopie, narzędzia do self-hostingu. Llama stał się fundamentem całego ekosystemu open-source AI.
Llama 3.x (2024) i kolejne wersje tylko rozszerzyły ten ekosystem. Dziś Llama jest najpopularniejszym modelem open-source i de facto standardem dla self-hosted deployments.
Czym jest Llama
Llama (Large Language Model Meta AI) to rodzina open-source modeli językowych Meta — dostępnych do pobrania i uruchamiania lokalnie bez opłat za API — stanowiąca fundament ekosystemu self-hosted AI i podstawę dla setek fine-tunedowanych modeli specjalizowanych, z wersjami od 1B do 405B parametrów.
Dlaczego open-source zmienia grę
Modele zamknięte (GPT, Claude, Gemini): API z opłatami per token, dane wysyłane do zewnętrznego serwera, zależność od providera.
Llama: zero opłat za inference (po zakupie infrastruktury), dane nie opuszczają twojego środowiska, możliwość fine-tuningu na własnych danych, brak zależności od providera.
Dla firm z wymaganiami data sovereignty, dla aplikacji z dużym wolumenem gdzie koszty API byłyby prohibitywne, dla zastosowań wymagających niskiej latencji na edge — Llama jest często właściwym wyborem.
Llama 3.x — stan 2025-2026
Llama 3.3 70B: jakość porównywalna z GPT-4o na większości benchmarkach przy odpowiednim GPU. Najlepszy stosunek jakości do kosztów dla self-hosted enterprise.
Llama 3.2 11B/90B Vision: multimodalne wersje z obsługą obrazu. Pierwsze modele Llama z native vision capability.
Llama 3.2 1B/3B: małe modele dla edge AI i on-device deployment. Llama 3.2 1B działa na smartphone z NPU.
Ekosystem na bazie Llama
Mistral, Qwen, Yi, Falcon — wszystkie korzystają z podobnej architektury i metodologii. Ollama, LM Studio, vLLM — narzędzia które uczynily self-hosting Llama tak prostym jak npm install. Hugging Face — centralny hub dla tysięcy fine-tunedowanych wariantów.