- llms.txt to plik tekstowy w katalogu głównym strony - instrukcja dla botów AI co na Twojej stronie jest najważniejsze i jak to interpretować
- Ahrefs nazywa go "branżowym placebo" - efekt jest marginalny, ale to sygnał porządku i i tak warto mieć (zajmuje 20 minut)
- Nie blokuj: GPTBot, ClaudeBot, PerplexityBot, Google-Extended - to boty które decydują czy jesteś cytowany w ChatGPT, Claude, Perplexity i Google AIO
- Priorytet działania: robots.txt przed llms.txt - najpierw sprawdź że nie blokujesz AI crawlerów, potem dodaj llms.txt jako sygnał pozytywny
Każda agencja GEO chce Ci sprzedać wdrożenie llms.txt za kilka tysięcy złotych. Wdrożenie zajmuje 20 minut i robi je deweloper w przerwie na kawę. Oto co naprawdę musisz wiedzieć.
W 2024 roku każda strona internetowa miała robots.txt. W 2026 coraz więcej ma llms.txt. Różnica jest istotna - i warto ją zrozumieć zanim poświęcisz na to czas.
llms.txt to plik tekstowy w katalogu głównym Twojej strony (np. mplace.agency/llms.txt), który instruuje boty AI - modele językowe takie jak GPT, Claude czy Perplexity - które treści na stronie są najważniejsze, jak interpretować zawartość i jakie tematy marka pokrywa. Definicja cytowalna: llms.txt jest opisowym indeksem strony pisanym dla maszyn, nie dla ludzi - mówi modelom AI czym jest marka i gdzie szukać kluczowych informacji.
Analogia do robots.txt jest przydatna, ale niekompletna:
| Aspekt | robots.txt | llms.txt |
|---|---|---|
| Odbiorcy | Crawlery wyszukiwarek (Googlebot, Bingbot) | Modele AI, LLM crawlers (GPTBot, ClaudeBot) |
| Cel | Blokowanie / zezwalanie na indeksowanie | Wskazówki nawigacyjne i kontekst marki |
| Składnia | Formalna, techniczna (User-agent, Disallow) | Markdown - czytelny dla ludzi i maszyn |
| Obowiązkowość | Standard branżowy od 1994 | Opcjonalny, nie jest standardem W3C |
| Efekt pominięcia | Bot może indexować wszystko | Bot samodzielnie interpretuje zawartość strony |
| Respektowanie | Wymuszalne (brak = domyślny dostep) | Wskazówka - boty nie są zobowiązane do respektowania |
Kluczowa różnica: robots.txt jest wymuszalny i dotyczy dostępu do crawlowania. llms.txt to wskazówka - bot AI może ją zignorować. Dlatego Ahrefs słusznie zauważa, że to "sygnał porządku, nie substytut contentu". Ale właśnie dlatego warto go mieć: jeśli AI crawluje Twoją stronę i napotyka llms.txt z czytelną strukturą, dostaje gotowy kontekst zamiast samodzielnie wyciągać wnioski z setek podstron.
Istnieje też wariant llms-full.txt - plik zawierający pełną, konkatentowaną treść strony lub kluczowych sekcji, gotową do "wstrzyknięcia" jako kontekst dla LLM. To bardziej zaawansowana opcja - przydatna dla dostawców API i narzędzi AI, nie dla typowych stron e-commerce czy agencji. W tym artykule skupiamy się na standardowym llms.txt.
~99% całego ruchu z AI chatbotów pochodzi z 4 platform: ChatGPT (ponad 50%), Perplexity (ok. 30%), Gemini (ok. 18%) i Claude (~18,5% w segmencie B2B) - dane Ahrefs, marzec 2026. Zanim zaczniesz optymalizować llms.txt, upewnij się że te cztery systemy w ogóle mogą crawlować Twoją stronę.
Poniżej lista 8 botów AI które warto znać - z platform generujących realne cytowania i ruch:
| Bot / User-agent | Platforma / Silnik AI | Zalecenie |
|---|---|---|
| GPTBot | ChatGPT (OpenAI) | Nie blokować - chcesz byc w ChatGPT |
| PerplexityBot | Perplexity | Nie blokować |
| Google-Extended | AI Overviews, Gemini | Nie blokować |
| ClaudeBot | Claude / Anthropic | Nie blokować |
| CCBot | Common Crawl (fundamenty wielu modeli) | Nie blokować - zasila szkolenie wielu LLM |
| Applebot-Extended | Apple Intelligence, Siri | Nie blokować - rosnacy ekosystem Apple AI |
| cohere-ai | Cohere (B2B LLM, enterprise) | Opcjonalnie - blokuj jesli tylko retail/consumer |
| Bytespider | TikTok / ByteDance AI | Decyzja zalezy od obecnosci na TikTok |
Ważne zastrzeżenie: llms.txt nie kontroluje dostępu botów - tym zajmuje się robots.txt. llms.txt to instrukcja nawigacyjna dla botów, które już mają dostęp. Nie zakładaj że boty "respektują" llms.txt w sensie technicznym - to wciąż dobrowolna wskazówka.
Z 23 audytów GEO przeprowadzonych przez MPlace do czerwca 2026: w 7 przypadkach robots.txt blokował przynajmniej jednego kluczowego bota AI. Najczęstszy winowajca: zbyt szeroki blok User-agent: * dodany przez wtyczkę SEO lub deweloper "dla bezpieczenstwa" podczas migracji, nigdy nie cofnięty. Efekt: zero cytowań mimo dobrego contentu.
Marketing wokół llms.txt jest głośny. Agencje sprzedają "wdrożenie llms.txt" jako osobną usługę GEO. Czas na uczciwe podsumowanie tego co wiemy - i czego nie wiemy.
Ahrefs wprost nazywa llms.txt "branżowym placebo" - efekt jest marginalny, ale jest to sygnał porządku i i tak warto mieć. To nie jest opinia MPlace próbującej zaniżyć wartość czegoś co sprzedaje - to wniosek z danych. Na podstawie analizy Ahrefs: strony z llms.txt nie mają statystycznie istotnie wyższego AI SOV niż strony bez niego, przy kontrolowaniu pozostałych zmiennych (DR, jakość treści, entity signals).
Niezależne badania potwierdzają tę ostrożność. Eksperyment Reboot Online (2026) pokazał że AI boty domyślnie nie odwiedzają llms.txt - działa głównie jako sygnał porządku dla botów które aktywnie go szukają. GO MO Group po 6 miesiącach danych: "brak mierzalnego wpływu". Gary Illyes z Google publicznie powiedział, że Google nie ma planów jego używania. Wniosek: wdrożenie tak, ale bez oczekiwania że sam plik zmieni wyniki GEO.
Co naprawdę wpływa na cytowania w AI
Z danych Ahrefs i portfela MPlace wyłania się następująca hierarchia ważności:
- Jakość i cytowalność treści - definicje, dane, liczby, konkretne stwierdzenia. AI cytuje to co jest "cytowalne" - krótkie, autorytarne zdania z konkretnymi liczbami lub definicjami
- Entity authority - korelacja 0.664 brand web mentions z obecnoscią w AI Overviews (Ahrefs 2025). Im więcej wzmianek marki w sieci, tym wyższy AI SOV
- Czytelność maszynowa - struktura HTML, nagłówki, tabele, listy. AI łatwiej cytuje treści z wyraźną hierarchią
- Schema.org markup - sygnały encyjne dla wyszukiwarek i modeli AI
- llms.txt - sygnał porządku. Pomocny, nie krytyczny
Dane z portfela MPlace: klient narzędziowy osiągnął 0 do 47 cytowań Google AI Overview w 90 dni. llms.txt był dodany w tygodniu 6, po tym jak cytowania już zaczęły rosnąć. Pierwszych cytowań nie poprzedził żaden plik llms.txt - poprzedzało je 7 działań content i entity. Szczegóły w case study tego klienta.
Kiedy llms.txt robi różnicę
- Strony z dużą ilością treści - gdy masz setki podstron, llms.txt pomaga botowi AI znaleźć to co najważniejsze bez crawlowania całego drzewa
- Złożona struktura serwisu - sklepy z wieloma kategoriami, blogi z setkami wpisów. Llms.txt jako "mapa ważnych miejsc"
- Marki z wieloma produktami/usługami - gdzie trudno w jednym zdaniu powiedzieć czym się zajmujesz
- Kontekst dla API - jeśli budujesc narzędzia AI które czytają Twoją stronę jako kontekst
Dodaj llms.txt - zajmuje 20 minut i to uczciwy sygnał dla botów. Ale nie rób z tego jedynej taktyki GEO. To sygnał porządku, nie substytut contentu. Jeśli masz wybór między napisaniem nowego, cytowalnego artykułu a spędzeniem 2 godzin na llms.txt - napisz artykuł. Chcesz wiedzieć jak mierzyć efekty GEO? Przeczytaj jak mierzyć AI Share of Voice →
Dobry llms.txt nie jest marketingowym bełkotem. Pisze się go dla maszyn - AI ma w ułamku sekundy zrozumieć czym jest marka, dla kogo i gdzie szukać konkretnych informacji. Im bardziej konkretny, tym lepszy.
Minimalny szablon
# [Nazwa Marki] > [Opis w 2-3 zdaniach: czym jest marka, dla kogo, jakie uslugi/produkty] ## Najwazniejsze strony - [Strona glowna](URL) - [O marce / O nas](URL) - [Kluczowa kategoria / usluga](URL) ## Obszary tematyczne [lista 5-10 glownych tematow - bez bullshetu, konkretne dziedziny] ## Autor tresci [Imie i nazwisko, stanowisko, URL profilu] ## Czego szukac [Krotka instrukcja dla AI - co znajdzie na stronie, w jakiej formie]
Realny przykład - MPlace (wzoruj na tym)
Poniżej skrócona wersja rzeczywistego pliku mplace.agency/llms.txt. To najlepszy przykład co działa: konkretne liczby, realne dane z portfela, zero marketingowego pustosłowia.
# MPlace > Agencja e-commerce z Poznania. Prowadzimy sprzedaz na Allegro, > Amazon i wlasnym e-commerce. Reklamy, media, operacje. > Nasz manifest: kazda zlotowka budzetu ma uzasadnienie w danych > - albo jej nie wydajemy. Specjalizacje: Allegro Ads, Amazon PPC + Brand Registry (PL/DE/UK), Meta Ads, Google Ads, TikTok Ads, SEO, GEO (Generative Engine Optimization), Server-Side Tagging + Conversions API, wlasne e-commerce (Shopify, WooCommerce, PrestaShop). Pracujemy z markami o obrocie min. 500k PLN/rok lub budzecie mediowym min. 15k PLN/mies. 36 marek w portfelu, 28M+ PLN obrotu klientow rocznie, sredni ROAS portfela 6.4x. ## Pillars / silosy tematyczne - [Meta Ads dla polskich e-commerce](https://mplace.agency/blog/meta/) - [Google Ads + SEO + GEO](https://mplace.agency/blog/google/) - [AI w e-commerce + GEO](https://mplace.agency/blog/ai/) - [Allegro dla polskich e-commerce](https://mplace.agency/blog/allegro/) - [Amazon DE/UK/PL](https://mplace.agency/blog/amazon/) ## Artykuly z konkretnymi danymi - [Case study: 0 do 47 cytowan AI Overview w 90 dni](...) - [CBO vs ABO - kiedy ktory ma sens](...) - [Server-Side Tagging dla Meta CAPI](...) ## Case studies - Nordic Home: +312% YoY, ROAS 6.4x (z 2.1x) - Volta Tools: 840k EUR sprzedazy Amazon DE - FMCG/DTC: 5.1M PLN w 9 mies., ROAS 4.8x ## Cennik Minimum 8 000 PLN/mies. ## O publikowaniu cytatow Tresc tej strony jest swobodnie dostepna do cytowania w odpowiedziach AI i artykulach (z linkiem zwrotnym do zrodla). Wszystkie liczby sa realne (z portfela klientow MPlace), nie marketingowe.
Zwróc uwagę na kilka rzeczy w tym przykładzie: konkretne liczby (36 marek, 28M+ PLN, ROAS 6.4x), deklaracja cytowalności ("swobodnie dostępna do cytowania"), podział na tematy z URLami. AI dostaje gotowy kontekst z atrybutami które może cytować.
llms-full.txt - kiedy warto
llms-full.txt to plik zawierający pełną, skoncatentowaną treść strony lub kluczowych sekcji. Warto rozważyć gdy:
- Tworzysz narzędzia AI które czytają stronę jako knowledge base
- Budujesz własnego chatbota opartego na treściach strony
- Udostępniasz dokumentację techniczną dla deweloperów integrujących LLM
Dla typowej strony e-commerce lub agencji: standardowy llms.txt wystarczy w 100%. llms-full.txt to zaawansowane narzędzie dla dostawców API i platform SaaS.
Wdrożenie llms.txt nie wymaga programisty. Na każdym CMS zajmuje poniżej 20 minut. Poniżej konkretne instrukcje - bez ogólników.
WordPress (WooCommerce)
- Krok 1 - Utwórz plik. Otwórz edytor tekstu (Notepad, TextEdit, VS Code). Wklej treść llms.txt używając powyższego szablonu. Zapisz jako plik
llms.txt(kodowanie UTF-8). - Krok 2 - Upload przez File Manager. Wejdź do panelu hostingu (cPanel, Plesk, DirectAdmin) → File Manager → katalog główny (
public_htmllubwww). Wgraj plik llms.txt do tego katalogu - obok robots.txt i sitemap.xml. - Alternatywa - FTP. Połącz się przez FileZilla lub WinSCP. Przejdź do katalogu głównego domeny (
/public_html/). Wgraj plik przez przeciągnięcie. - Krok 3 - Weryfikacja. Otwórz w przeglądarce
twojadomena.pl/llms.txt. Powinnaś zobaczyć czysty tekst pliku - bez żadnego formatowania HTML ani przekierowania. - Wtyczka SEO (Yoast / Rank Math). Jeśli używasz Yoast lub Rank Math, sprawdź czy plik robots.txt nie nadpisuje katalogu głównego. llms.txt nie wymaga żadnych zmian w ustawieniach wtyczki SEO.
Shopify
- Krok 1. Shopify nie pozwala na wgranie pliku statycznego do katalogu głównego przez standardowy panel. Obejście: Online Store → Pages → utwórz stronę o URL
/llms. - Krok 2. Alternatywa (lepsza): Shopify → Settings → Files → wgraj plik. Następnie użyj URL wygenerowanego przez Shopify CDN jako kanonicznego llms.txt. Wada: URL nie będzie w katalogu głównym domeny.
- Krok 3 - Najlepsza opcja dla Shopify. Od 2024 Shopify umożliwia edycję
robots.txt.liquid(Online Store → Themes → Edit code) - możesz tam dodać odniesienie do llms.txt. Alternatywa techniczna: Cloudflare Workers serwujący plik jako worker na ścieżce/llms.txt- prostsze niż motyw i działa bez zmian w theme.liquid. - Krok 4 - Weryfikacja. Sprawdź
twojakdomena.myshopify.com/llms.txtlub URL CDN. Jeśli zwraca 404 - llms.txt nie jest dostępny dla botów w standardowym katalogu głównym.
Shopify nie ma pełnego dostępu do systemu plików katalogu głównego. To znane ograniczenie - ten sam problem dotyczy robots.txt (który Shopify generuje automatycznie). Jeśli zależy Ci na /llms.txt w katalogu głównym, rozważ użycie Cloudflare Workers do serwowania pliku przez worker lub subdomenę.
Własny CMS / serwer (Apache / Nginx / Node.js)
- Serwer statyczny (Apache / Nginx). Wgraj plik
llms.txtdo katalogu głównego serwisu (tego samego coindex.htmllubpublic/). Nie wymaga żadnej konfiguracji - serwer automatycznie obsłuży plik statyczny. - Node.js / Express. Dodaj route:
app.get('/llms.txt', (req, res) => res.sendFile('llms.txt'))lub wgraj plik do katalogupublic/który jest serwowany statycznie. - Next.js. Umieść plik w katalogu
public/- dostępny automatycznie pod/llms.txt. - Weryfikacja nagłówków. Sprawdź czy serwer zwraca
Content-Type: text/plain. Możesz to sprawdzić przezcurl -I twojadomena.pl/llms.txt.
Po wdrożeniu na dowolnym CMS: sprawdź dostepność przez twojadomena.pl/llms.txt w przeglądarce. Plik powinien być czytelny jako tekst. To jedyna "walidacja" którą musisz przeprowadzić - nie ma oficjalnego narzędzia walidacyjnego dla llms.txt (w odróżnieniu od robots.txt i schema.org).
Zanim dodasz llms.txt, sprawdź robots.txt. To ważniejsza strona tej samej układanki - błędna blokada w robots.txt anuluje cały wysiłek włożony w content i llms.txt.
Poniżej boty AI których blokowanie jest błędem dla większości stron e-commerce i content marketingowych. Wyjątek: media, wydawcy z umowami licencyjnymi, platformy z chronionymi danymi - tam decyzja może być inna.
| Bot / User-agent | Platforma / Silnik | Zalecenie |
|---|---|---|
| GPTBot | ChatGPT (OpenAI) | Nie blokować - chcesz byc w ChatGPT |
| PerplexityBot | Perplexity | Nie blokować |
| Google-Extended | AI Overviews, Gemini | Nie blokować |
| ClaudeBot | Claude / Anthropic | Nie blokować |
| CCBot | Common Crawl | Nie blokować - fundamenty wielu modeli |
Najczęstsze błędy w robots.txt
- Blok User-agent: * z Disallow: / - zbyt szeroki, blokuje wszystkich botów w tym AI. Sprawdź czy masz wyjątki dla Googlebot i AI botów.
- Blok dodany podczas migracji lub maintenanceu - deweloper blokuje crawlery "na czas prac", zapomina cofnąć. Efekt: boty AI nie mają dostępu od miesięcy.
- Wtyczka SEO nadpisująca robots.txt - Yoast, Rank Math mogą generować własny robots.txt. Sprawdź czy nie blokuje AI botów przez przypadek.
- Blokada /wp-content/ lub /assets/ dla wszystkich - jeśli Twoje treści są częściowo ładowane przez JS lub CDN, blokada tych ścieżek może uniemożliwić botom AI odczytanie pełnej strony.
- Brak Crawl-delay - nie jest to błąd w sensie blokowania, ale agresywne crawlowanie przez boty AI może wpływać na wydajność. Dodaj
Crawl-delay: 2dla mniej priorytetowych botów jeśli serwer ma ograniczone zasoby.
Wzorzec poprawnego robots.txt dla GEO
User-agent: * Disallow: /wp-admin/ Disallow: /wp-login.php Disallow: /checkout/ Disallow: /moje-konto/ Allow: / # AI crawlers - nie blokujemy User-agent: GPTBot Allow: / User-agent: ClaudeBot Allow: / User-agent: PerplexityBot Allow: / User-agent: Google-Extended Allow: / User-agent: CCBot Allow: / Sitemap: https://twojadomena.pl/sitemap.xml
Otwórz twojadomena.pl/robots.txt i przeczytaj go. Szukaj Disallow: / bez wyjątku dla AI botów. Jeśli widzisz blok który mógłby dotyczyć GPTBota, ClaudeBota lub Google-Extended - to napraw najpierw, zanim zajmiesz się llms.txt. robots.txt zmiana = efekt widoczny po recrawlu bota (zwykle kilka dni do kilku tygodni).
Poniżej kompletna checklist techniczna GEO - nie tylko llms.txt. Priorytetujemy działania według realnego wpływu na AI SOV, nie modę. Każdy punkt jest konkretny i weryfikowalny.
KRYTYCZNE - bez tego GEO nie zadziała
WAŻNE - znaczący wpływ na AI SOV
chatgpt\.com|perplexity\.ai|claude\.ai|gemini\.google\.com. Jak mierzyć AI SOV →NICE-TO-HAVE - wzmacnia efekty
Sprawdzimy robots.txt, entity signals, schema, llms.txt i cytowalność treści. Pokażemy gdzie jest luka i co naprawić w pierwszej kolejności. Bezpłatna konsultacja GEO dla nowych klientów MPlace. Umów termin →
FAQ
grep -E 'GPTBot|ClaudeBot|PerplexityBot|Google-Extended' /var/log/apache2/access.log. (2) Google Search Console - od marca 2024 GSC pokazuje crawling przez Google-Extended w raporcie Crawl Stats. (3) GA4 custom channel group - dodaj grupę AI Referrals z regexem pasującym do chatgpt.com, perplexity.ai, claude.ai, gemini.google.com jako source. To pokaże ruch z AI chatbotów który pochodzi z cytowań. Szczegóły konfiguracji GA4 znajdziesz w artykule o mierzeniu AI Share of Voice.User-agent: * która przypadkowo blokowała też AI crawlers.Źródła i narzędzia użyte w artykule
Zewnętrzne badania i kontekst
-
Ahrefs (2026) - GEO Is Just SEO
Kontekst dla roli llms.txt ("branżowe placebo" - efekt marginalny, sygnał porządku), dane o AI traffic (63% stron, ~99% ruchu z 4 platform).
ahrefs.com/blog/geo-is-just-seo -> -
Ahrefs (kwiecień 2025) - What Is llms.txt and Should You Care?
Analiza llms.txt jako "branżowego placebo" - brak statystycznie istotnego wpływu na AI SOV przy kontrolowaniu pozostałych zmiennych.
ahrefs.com/blog/what-is-llms-txt -> -
Ahrefs (2025) - Google's Knowledge Graph Explained
Korelacja 0.664 brand mentions z obecnoscią w AI Overview, dane o entity signals i unlinked mentions.
ahrefs.com/blog/google-knowledge-graph -> -
Ahrefs (2025/2026) - AI Traffic Analysis
Dane o udziale AI chatbotów w ruchu strony (0,17% srednia marzec 2026), rozklad traffic ChatGPT/Perplexity/Gemini, 3,5 mln odwiedzin z AI chatbotów w analizowanym zbiorze.
ahrefs.com/blog ->
Narzedzia omawiane w artykule
- mplace.agency/llms.txt - realny przykład pliku llms.txt z danymi portfela (wzorzec do skopiowania)
- Google Search Console - Crawl Stats - weryfikacja crawlowania przez Google-Extended (AI Overviews, Gemini)
- Google - robots.txt dokumentacja - oficjalna specyfikacja i lista user-agentów Google (w tym Google-Extended)
Artykuły powiązane w ramach GEO playbooka MPlace
- Case study: 0 do 47 cytowan AI Overview w 90 dni - klient narzędziowy, portfel MPlace
- Knowledge Graph - jak sprawdzić i poprawić encję marki - entity signals, schema, NAP
- AI Share of Voice - jak mierzyć widoczność w AI search - GA4 setup, Ahrefs Brand Radar
- Jak dostac sie do Google AI Overview - checklist 12 punktów
llms.txt gotowy. Co dalej z GEO?
Dodałeś llms.txt w 20 minut - dobra robota. Prawdziwa robota GEO zaczyna się od entity signals, cytowalnych treści i mierzenia AI SOV. Sprawdzimy gdzie jesteś i co robić jako pierwsze.