Łańcuch myślenia

Technika promptowania w której model generuje explicite kroki wnioskowania przed odpowiedzią — znacząco poprawiająca jakość przy zadaniach wieloetapowych. Zero-shot CoT: "Myślmy krok po kroku". W agentach: ReAct łączy CoT z agent loop.

W Polsce nazywane też:

łańcuch myśleniachain-of-thoughtwnioskowanie krok po krokurozumowanie łańcuchowe

Model językowy poproszony bezpośrednio o odpowiedź na złożone pytanie — generuje ją jednym przebiegiem. Jak student który pisze odpowiedź nie sprawdzając swojego rozumowania. Rezultat może być poprawny, może zawierać subtelne błędy logiczne.

Chain-of-thought (CoT) to technika która każe modelowi „myśleć na głos” — generować kroki pośrednie zanim poda ostateczną odpowiedź. Jak student który pokazuje obliczenia. Wynik jest lepszy, a błędy są widoczne.

Czym jest chain-of-thought

Chain-of-thought (łańcuch myślenia) to technika promptowania modeli AI w której model jest zachęcany do generowania explicite kroków wnioskowania przed podaniem ostatecznej odpowiedzi — znacząco poprawiająca jakość odpowiedzi na zadania wymagające wieloetapowego rozumowania, matematyki, logiki i planowania.

Zero-shot CoT

Najprostsza forma: dodanie „Let’s think step by step” lub „Myślmy krok po kroku” do promptu. Model generuje łańcuch rozumowania przed odpowiedzią. Szokująco skuteczne dla zadań matematycznych i logicznych bez żadnych przykładów.

Few-shot CoT

Bardziej zaawansowana forma: dostarcz przykłady pytanie + łańcuch rozumowania + odpowiedź w prompcie. Model uczy się wzorca na przykładach i stosuje go do nowego pytania.

CoT w agentach

ReAct (Reasoning + Acting) to CoT zintegrowany z agent loop. Agent przed każdą akcją generuje explicite reasoning: „Użytkownik pyta o dostępność produktu. Sprawdzam w magazynie. [tool call] Magazyn zwrócił: dostępne 5 sztuk. Odpowiadam użytkownikowi.”

Ten explicite thought process ma trzy zalety w kontekście agentów: łatwiejszy debugging (widzisz skąd pochodzi decyzja), lepsze narzędziowe wywołania (model „przemyśla” co wywołać zanim to zrobi), możliwość implementacji scratchpad — agent może „zapisywać” myśli między krokami.

Extended thinking

Anthropic Claude 3.7+ i podobne modele mają wbudowane extended thinking — model generuje długi wewnętrzny łańcuch myślenia przed odpowiedzią, niewidoczny dla użytkownika (lub opcjonalnie widoczny). To jest systemowa implementacja CoT na poziomie modelu, nie techniki promptowania.

Kiedy CoT ma wartość

CoT zwiększa tokeny i latencję — dla prostych pytań jest zbędny. Wartość pojawia się przy: zadaniach wieloetapowych (planowanie, analiza), problemach wymagających sprawdzenia (matematyka, logika), zadaniach gdzie „po co” jest ważne (decyzje z uzasadnieniem), agentach gdzie transparency procesu decyzyjnego ma wartość dla operatora.

Ewaluacja agentaSystematyczny proces mierzenia jakości agenta AI — przez zestawy testowe, metryki (task completion, tool call accuracy, faithfulness) i powtarzalne uruchomienia statystyczne — pozwalający wykryć regresje przy zmianach i porównywać konfiguracje. LLM-as-judge jako popularny wzorzec.Wykrywanie hallucynacjiSystemy wykrywania nieprawdziwych twierdzeń generowanych przez modele AI — przez groundedness check, porównanie ze źródłami, factual consistency — stosowane jako guardrail przed wykonaniem akcji opartej na błędnej informacji. Trzy typy: factual, faithfulness, self-hallucination.Inżynieria promptów dla agentówPraktyka projektowania instrukcji dla agentów AI — system promptu, przykładów i strategii wnioskowania — tak żeby agent działał zgodnie z intencją przez wiele kroków autonomicznych działań, obsługiwał edge cases i wiedział kiedy eskalować. Trzy warstwy: tożsamość, granice, format.Model rozumującyKlasa modeli językowych która przed wygenerowaniem odpowiedzi wykonuje wewnętrzny proces rozumowania — chain of thought lub extended thinking — co znacząco poprawia jakość odpowiedzi na złożone problemy. Pierwszy popularny reasoning model: OpenAI o1 (wrzesień 2024).Pętla agentaPodstawowy cykl działania autonomicznego agenta AI — powtarzająca się sekwencja percepcji, planowania, akcji i oceny wyniku — która kontynuuje się aż agent osiągnie cel lub zostanie zatrzymany. Fundament architektoniczny każdego agenta który działa wielokrokowo.