Model AI nie czyta twojej strony jako jednolitego tekstu. Czyta ją w chunkach — fragmentach kilkudziesięciu do kilkuset słów wokół konkretnych nagłówków lub sekcji. Jakość tych chunków decyduje o jakości tego co model z twoją stroną zrobi: jak ją podsumuje, jak ją zacytuje, jak ją sklasyfikuje. Stąd AI Chunkability jako warstwa audytu.
Czym jest AI Chunkability
AI Chunkability to warstwa AI-readiness w frameworku ContentFox AI-Readiness Scanner oceniająca zdolność strony do bycia podzieloną na sensowne fragmenty (chunki) przez modele AI — mierzona przez średnią gęstość treści pod nagłówkami (rekomendacja >=80 słów per sekcja), oddzielenie treści merytorycznej od kodu/nawigacji/CTA, zwartość hierarchii nagłówków i obecność wyraźnych granic semantycznych między sekcjami.
Dlaczego chunki mają znaczenie
Modele AI z dostępem do web (Perplexity, ChatGPT Search, Claude z web search, AI Overviews) używają architektury RAG (Retrieval-Augmented Generation). RAG pobiera strony do bazy wektorowej, dzieli na chunki, embedduje, i przy zapytaniu wyszukuje najtrafniejsze chunki jako kontekst.
Jakość chunków = jakość kontekstu = jakość odpowiedzi modelu o twojej stronie.
Słaby chunk: 20 słów wokół nagłówka, dwie linie kodu JS, fragment menu. Model dostaje hałas. Albo cię nie zacytuje, albo zacytuje błędnie.
Dobry chunk: nagłówek + 100-200 słów spójnej treści merytorycznej + zamknięcie konceptu. Model dostaje samodzielny fragment który może użyć jako odpowiedź.
Metryki AI Chunkability
ContentFox AI-Readiness Scanner mierzy AI Chunkability przez kombinację:
Średnia liczba słów per sekcja (per nagłówek). Optimum: 80-150 słów. Zbyt mało (poniżej 30) = bezwartościowe chunki. Zbyt dużo (powyżej 300) = chunki za szerokie żeby były precyzyjne.
Stosunek nagłówków do akapitów. Strona z 31 nagłówkami i 20 akapitami jest fragmentaryczna — większość nagłówków nie ma pod sobą prawdziwej treści, tylko link/CTA/menu.
Obecność kodu / nawigacji w treści. Wykrywany przez wzorce typowe dla JS, CSS, link patterns. Każdy taki element obniża score.
Granice semantyczne. Czy strona używa