Robots.txt a soubor Sitemap (mapa stránek) představují dva základní pilíře technického SEO, které řídí, jak vyhledávače procházejí váš web a které stránky objeví. Zatímco robots.txt říká botům, jako je Googlebot, do kterých částí webu mohou a nemohou vstoupit, mapa stránek vyhledávačům předkládá seznam důležitých URL adres, data jejich poslední aktualizace a celkovou strukturu webu. Jednoduše řečeno: robots.txt usměrňuje procházení, sitemap urychluje objevování. Správně připravené soubory robots.txt a sitemap zásadně zvyšují efektivitu indexace, a to zejména u nových projektů, e-shopů, firemních webů a rozsáhlých obsahových archivů.
V tomto průvodci se krok za krokem podíváme na to, jak robots.txt a soubor sitemap vytvořit, jaká pravidla používat, na co si dát pozor u WordPressu a webů na míru, jak testovat chyby a jak soubory odeslat do Googlu. Tento obsah, připravený pro blog Hostragons, je zaměřen na vyhledávací záměr, technickou přesnost, rozpočet na procházení, indexovatelnost a praktické nasazení v souladu se SEO standardy pro rok 2026.
Co je to robots.txt?
Robots.txt je obyčejný textový soubor umístěný v kořenovém adresáři vašeho webu. Obvykle je dostupný na adrese https://vasedomena.cz/robots.txt. Tento soubor dává botům vyhledávačů instrukce, které složky nebo stránky mohou procházet a kterým by se měly vyhnout. Zásadní je toto: robots.txt není bezpečnostní nástroj. Je to pouze doporučení pro slušně vychované boty.
Můžete jím například uzavřít administrační panel, kroky košíku, filtrační parametry, stránky s výsledky vyhledávání nebo testovací adresáře. Rozhodně jím ale neschovávejte citlivé údaje. Soubor je totiž veřejně viditelný. Pro skutečné zabezpečení je nutné použít ochranu heslem, omezení přístupu na straně serveru, bezpečnou konfiguraci hostingu a SSL. V tomto ohledu můžete pro základní bezpečnost vašeho webu zvážit SSL certifikát a pro výkonnou infrastrukturu webhosting.
K čemu slouží soubor robots.txt?
- Usměrňuje chování botů vyhledávačů při procházení.
- Snižuje procházení nedůležitých nebo duplicitních stránek.
- Pomáhá alokovat rozpočet na procházení ve prospěch důležitých stránek.
- Informuje roboty o umístění souboru mapy stránek.
- Může zablokovat procházení testovacích, administračních, interních vyhledávacích a parametrických URL.
Zejména u webů s tisíci produktů, kategorií, štítků nebo filtračních stránek může špatně nastavený robots.txt způsobit, že Google důležité stránky objeví pozdě. Naopak příliš restriktivní soubor může zablokovat CSS, JavaScript, obrázky nebo důležité kategorie, což může poškodit vaše pozice ve vyhledávání.
Co je to Sitemap?
Sitemap, česky mapa stránek, je soubor ve formátu XML, který vyhledávačům předkládá seznam důležitých URL adres na vašem webu. Obvykle se nachází na adrese https://vasedomena.cz/sitemap.xml. Mapa stránek vyhledávačům říká: "Tyto stránky jsou pro mě důležité, prosím, objev je a zařaď ty vhodné do procesu indexace."
Soubor sitemap může obsahovat informace jako URL adresu, datum poslední aktualizace, frekvenci změn a prioritu. V SEO přístupu pro rok 2026 nabývá na důležitosti zejména datum poslední aktualizace. Vyhledávače totiž chtějí efektivněji objevovat aktuální a kvalitní obsah. Samotná mapa stránek však negarantuje indexaci. To, že je URL v sitemapu, neznamená, že se automaticky zobrazí ve výsledcích Googlu. Stránka musí být kvalitní, přístupná, indexovatelná, musí mít správně nastavenou kanonizaci a odpovídat vyhledávacímu záměru uživatele.
Kdy je soubor Sitemap nezbytný?
- Pokud máte zcela nový web.
- Pokud máte velké množství stránek, produktů nebo blogových příspěvků.
- Pokud je interní prolinkování vašeho webu slabé.
- Pokud máte hodně obrázkového, video nebo zpravodajského obsahu.
- Pokud na e-shopu často aktualizujete produkty.
- Pokud pravidelně aktualizujete starší obsah.
Používání mapy stránek je dobrým zvykem i u malých webů s přehlednou strukturou interních odkazů. Mapa stránek totiž vyhledávačům nabízí jasný seznam URL a snižuje možná zpoždění při jejich objevování.
Rozdíly mezi robots.txt a Sitemap
Přestože robots.txt a sitemap spolupracují, jejich úkoly se liší. Robots.txt hraje roli spíše v povolování a omezování procházení, zatímco sitemap vypisuje URL, které si přejete nechat objevit. Následující tabulka shrnuje hlavní rozdíly.
| Vlastnost | Robots.txt | Sitemap |
|---|---|---|
| Hlavní účel | Řídit, které oblasti boti procházejí | Informovat vyhledávače o důležitých URL |
| Umístění souboru | Kořenový adresář: /robots.txt | Obvykle /sitemap.xml |
| Formát | Prostý text | XML |
| Garantuje indexaci? | Ne | Ne |
| Riziko špatného použití | Může zablokovat procházení důležitých stránek | Může odeslat nekvalitní nebo noindex stránky |
| SEO efekt | Pomáhá řídit rozpočet na procházení | Posiluje objevování URL a signál o aktualizaci |
Jak vytvořit soubor robots.txt?
Vytvoření souboru robots.txt je technicky jednoduché, ale ze SEO hlediska vyžaduje pozornost. Soubor musí být pojmenován malými písmeny jako robots.txt a musí být nahrán do kořenového adresáře webu. Správná cesta je tedy https://vasedomena.cz/robots.txt. Soubor robots.txt nahraný do podadresáře není považován za platný.
1. Vytvořte základní strukturu robots.txt
Nejjednodušší struktura dává všem botům svolení procházet web a informuje o umístění mapy stránek:
- User-agent: *
- Allow: /
- Sitemap: https://vasedomena.cz/sitemap.xml
Zde User-agent: * označuje všechny roboty. Allow: / povoluje procházení celého webu. Řádek Sitemap pak sděluje umístění mapy stránek. Pro nově založený web, u kterého si přejete indexaci, je tato struktura obvykle bezpečným začátkem.
2. Určete oblasti, které nechcete procházet
Ne každá stránka musí být procházena. Zejména uživatelsky specifické, dočasné, duplicitní stránky nebo stránky s nízkou SEO hodnotou lze omezit pomocí robots.txt. Například:
- Disallow: /wp-admin/
- Disallow: /kosik/
- Disallow: /platba/
- Disallow: /vyhledavani/
- Disallow: /test/
U WordPress webů je běžné zablokovat procházení složky /wp-admin/. Aby však některé AJAX soubory WordPressu fungovaly, je nutné povolit soubor /wp-admin/admin-ajax.php. Ukázková struktura pro WordPress proto může vypadat takto:
- User-agent: *
- Disallow: /wp-admin/
- Allow: /wp-admin/admin-ajax.php
- Sitemap: https://vasedomena.cz/sitemap.xml
V tomto příkladu je administrace uzavřena, zatímco AJAXové požadavky potřebné pro šablony a pluginy jsou povoleny. Pro rychlejší a stabilnější provoz vašeho WordPress webu se můžete podívat na WordPress hosting.
3. U e-shopů kontrolujte parametry a filtry
Na e-shopech mohou filtrování, řazení, barva, velikost, cenové rozpětí, skladová dostupnost a vyhledávací parametry generovat obrovské množství URL. Například stejná kategorie se může množit v těchto variantách: /boty?barva=cerna, /boty?velikost=42, /boty?sort=cena_vzestupne. Pokud tato struktura není pod kontrolou, mohou boti Googlu procházet tisíce parametrických stránek s nízkou hodnotou.
Pro tyto oblasti je třeba kombinovat robots.txt, kanonické značky a data z Google Search Console. Zablokovat každý parametr pouze pomocí robots.txt není vždy správné řešení. Některé filtrační stránky totiž mohou nést komerční vyhledávací záměr. Pokud má například "černé pánské sportovní boty" SEO hodnotu, měla by být naplánována jako samostatná indexovatelná kategorie.
4. Neblokujte CSS a JavaScript soubory
V moderním SEO Google nehodnotí stránky jen jako HTML, ale v jejich vykreslené podobě. Blokování CSS a JavaScript souborů proto může Googlu ztížit pochopení rozvržení stránky, mobilní přívětivosti, menu nebo struktury načítání obsahu. Dříve používaná široká pravidla jako Disallow: /assets/ nebo Disallow: /js/ jsou dnes riskantní.
Bezpečný přístup pro rok 2026 je: CSS, JS, obrázkové a fontové soubory, které tvoří uživatelský zážitek, by měly být botům přístupné. Omezovat by se měly pouze adresáře, které opravdu není třeba procházet, jako jsou administrační, dočasné nebo soukromé složky.
5. Otestujte soubor robots.txt
Po nahrání souboru jej nezapomeňte otestovat. Měli byste zkontrolovat:
- Otevírá se adresa https://vasedomena.cz/robots.txt se stavovým kódem 200?
- Není soubor prázdný, chybný nebo nepatří k jiné doméně?
- Ukazuje řádek Sitemap na správnou URL?
- Nejsou blokovány důležité kategorie, produkty, služby nebo blogové stránky?
- Nejsou omylem uzavřeny CSS, JS a obrazové zdroje?
Pomocí nástroje Kontrola URL v Google Search Console můžete ověřit, zda lze důležité stránky procházet. Pokročilou, ale velmi cennou metodou je také analýza serverových logů, která ukáže, které URL Googlebot navštěvuje. Pro silný výkon serveru a správnou konfiguraci můžete zvážit VPS server nebo firemní hosting.
Jak vytvořit soubor Sitemap?
Cílem při vytváření mapy stránek je předložit vyhledávačům čistý seznam kvalitních URL, které si přejete indexovat. Ne každá URL musí být v sitemapu obsažena. Naopak, přidávání stránek s noindex, přesměrovaných, chybových nebo duplicitních může vytvářet negativní signál.
1. Přidávejte pouze indexovatelné URL
Stránky, které do sitemapu přidáte, by měly splňovat tato kritéria:
- Musí vracet stavový kód 200.
- Nesmí obsahovat značku noindex.
- Nesmí být blokovány v robots.txt.
- Kanonická značka by měla ukazovat na sebe nebo správný cíl.
- Musí obsahovat unikátní obsah přinášející hodnotu uživateli.
- Měly by být responzivní a rychle se načítat.
Například smazané produktové stránky, trvale odstraněné produkty, výsledky interního vyhledávání, stránky košíku a pokladny by v sitemapu být neměly. Naopak hlavní kategorie, důležité podkategorie, stránky služeb, blogové příspěvky a aktivní produkty by do mapy stránek zahrnuty být měly.
2. Používejte správný formát XML Sitemap
Jednoduchá struktura XML sitemapu se vytváří podle této logiky:
- <urlset> je hlavní obal.
- <url> je samostatný blok pro každou stránku.
- <loc> obsahuje úplnou URL stránky.
- <lastmod> uvádí datum poslední aktualizace stránky.
Příklad záznamu URL může vypadat takto: <loc>https://vasedomena.cz/sluzby/</loc> a <lastmod>2026-01-15</lastmod>. Doporučuje se formát data rok-měsíc-den. Je důležité pole lastmod aktualizovat automaticky a správně. Není důvěryhodnou praktikou měnit datum u všech URL každý den jen proto, aby se Google aktivoval.
3. U velkých webů rozdělte sitemap na části
Standardní XML soubor sitemap by měl obsahovat maximálně 50 000 URL a jeho nekomprimovaná velikost by neměla přesáhnout 50 MB. U rozsáhlých webů je zdravější použít index sitemap místo jednoho souboru. Například:
- /post-sitemap.xml
- /page-sitemap.xml
- /product-sitemap.xml
- /category-sitemap.xml
- /image-sitemap.xml
Tato struktura umožňuje vyhledávačům zpracovávat soubory efektivněji a usnadňuje analýzu, u kterého typu obsahu je problém s indexací. Pokud je například z 20 000 URL v produktovém sitemapu indexováno pouze 8 000, je třeba samostatně prověřit popisy produktů, skladovou dostupnost, duplicitní obsah, rychlost stránek nebo strukturu filtrování.
4. Tvorba Sitemap ve WordPressu
WordPress od verze 5.5 obsahuje vestavěnou funkci XML sitemap. Standardně je dostupná na adrese /wp-sitemap.xml. V mnoha profesionálních projektech jsou však upřednostňovány SEO pluginy jako Rank Math, Yoast SEO nebo podobné, protože nabízejí pokročilejší kontrolu nad mapou stránek. Pomocí těchto pluginů lze určit, které typy obsahu budou do sitemapu zahrnuty, zda se budou zobrazovat archivy štítků a jak spravovat archivy autorů.
Častou chybou na WordPress webech je přidávání stránek štítků s nízkou hodnotou do sitemapu. Pokud stránky štítků nemají unikátní popis, silné interní prolinkování a reálnou poptávku ve vyhledávání, je lepší je ze sitemapu vynechat. Pro posílení vaší obsahové strategie můžete odkázat i na téma SEO copywriting.
5. Nastavte automatizaci sitemap na webech na míru
Na webech s vlastním redakčním systémem lze sitemap připravit ručně, ale u dynamických projektů je nutná automatická generace. Když je přidán produkt, publikován blogový příspěvek nebo aktualizována stránka služby, měl by se automaticky aktualizovat i sitemap. Vývojářský tým by měl implementovat tato pravidla:
- Publikované stránky jsou automaticky přidávány do sitemapu.
- Smazané nebo 404 URL jsou ze sitemapu odstraněny.
- Stránky s noindex nejsou do sitemapu zařazeny.
- Stránky s odlišným kanonickým cílem jsou pečlivě spravovány.
- Lastmod je aktualizován pouze při skutečné změně obsahu.
Tato automatizace je kriticky důležitá pro technické SEO zdraví zejména u často aktualizovaných zpravodajských, inzertních, rezervačních, vzdělávacích a e-commerce projektů.
Jak uvést Sitemap v souboru robots.txt?
Je dobrou praxí přidat adresu sitemapu na konec souboru robots.txt. Boti tak mohou vaši mapu stránek snadno najít. Příklad použití:
- User-agent: *
- Allow: /
- Sitemap: https://vasedomena.cz/sitemap.xml
Pokud máte více souborů sitemap, můžete každý uvést na samostatném řádku:
- Sitemap: https://vasedomena.cz/post-sitemap.xml
- Sitemap: https://vasedomena.cz/product-sitemap.xml
- Sitemap: https://vasedomena.cz/category-sitemap.xml
Pokud na své doméně používáte HTTPS, musí být i URL sitemapů v HTTPS. Neměly by se míchat varianty HTTP, www a non-www. Proto je důležité hned od začátku správně nastavit doménu, SSL a přesměrování. Pokud začínáte nový projekt, řešte kroky kontrola domény a SSL certifikát společně s vaším plánem technického SEO.
Odeslání Sitemap do Google Search Console

Po vytvoření sitemapu je nutné jej odeslat prostřednictvím Google Search Console. Postup je následující:
- Přihlaste se do Google Search Console.
- Vyberte správnou službu. Nejlépe použijte službu na úrovni domény.
- V levém menu přejděte do sekce Mapy stránek.
- Zadejte URL sitemapu. Například sitemap.xml.
- Klikněte na tlačítko Odeslat.
- V sekci Stav zkontrolujte hlášení "Úspěšně" a počet objevených URL.
Po odeslání sitemapu neočekávejte okamžitou indexaci všech stránek. Google nejprve URL objeví, projde, zpracuje a na základě signálů kvality se rozhodne, zda je indexovat. U nových webů může tento proces trvat několik dní až několik týdnů. Silné interní prolinkování, kvalitní obsah a rychlá odezva serveru tento proces pozitivně ovlivňují.
Nejčastější chyby v robots.txt a Sitemap
1. Nechtěné zablokování celého webu
Nejkritičtější chybou je ponechání pravidla Disallow: / na živém webu. Toto pravidlo brání procházení celého webu. Pokud toto nastavení, používané ve vývojovém prostředí, není při nasazení na produkci odstraněno, Google nemůže procházet nové stránky. Na kontrolním seznamu před spuštěním webu nesmí robots.txt chybět.
2. Přidávání noindex stránek do Sitemap
Když stránce nastavíte noindex a zároveň ji přidáte do sitemapu, vytváříte protichůdný signál. Sitemap říká "tato stránka je důležitá", zatímco noindex říká "tuto stránku neindexovat". Sitemap by proto měl obsahovat pouze URL, které si přejete indexovat.
3. Ponechávání URL s 301, 404 nebo 500 v mapě stránek
URL v sitemapu by měly ideálně vracet stavový kód 200. Přesměrované, nenalezené nebo chybové URL by měly být pravidelně čištěny. Provádění měsíčního technického SEO auditu vám pomůže tyto chyby včas zachytit.
4. Použití špatné domény nebo protokolu
Pokud používáte https://www.vasedomena.cz, musí být i URL v sitemapu ve stejném formátu. Různé varianty protokolu nebo domény mohou Googlu ztížit konsolidaci signálů. Proto by kanonická URL, sitemap, robots.txt a struktura přesměrování měly ukazovat na stejný hlavní formát URL.
5. Odesílání příliš velkého množství URL
Sitemap není odpadkový koš. Místo přidávání každé URL přidejte jen ty kvalitní stránky, které opravdu chcete indexovat. Vynechání nekvalitních, duplicitních nebo slabých stránek z mapy stránek vysílá vyhledávačům čistší signál.
Checklist technického SEO pro rok 2026
Při přípravě souborů robots.txt a sitemap můžete použít následující kontrolní seznam:
- Je robots.txt v kořenovém adresáři a je přístupný?
- Je adresa sitemapu správně uvedena v robots.txt?
- Nejsou důležité stránky blokovány pomocí robots.txt?
- Jsou CSS, JavaScript a obrazové zdroje přístupné pro procházení?
- Obsahuje sitemap pouze indexovatelné URL vracející kód 200?
- Jsou stránky s noindex mimo sitemap?
- Odrážejí data lastmod skutečné aktualizace?
- Používá se u velkých webů index sitemap?
- Byl sitemap úspěšně zpracován v Google Search Console?
- Podporují časy odezvy serveru efektivitu procházení?
Technické SEO není jen o vytváření souborů. Přímo na něj má vliv i výkon hostingu, konfigurace SSL, správnost DNS, přesměrování, mobilní přívětivost a kvalita obsahu. Proto je při plánování infrastruktury vašeho projektu výhodné zvažovat společně hostingové balíčky, převod domény a zabezpečení webových stránek.
Příklad strategie pro robots.txt a Sitemap
Pro jednoduchý firemní web může být doporučená struktura následující: Domovská stránka, stránky služeb, o nás, kontakt a blogové příspěvky jsou součástí sitemapu. Administrační panel, děkovací stránky formulářů, dočasné testy kampaní a výsledky interního vyhledávání jsou řízeny pomocí robots.txt nebo noindex. Na takovém webu se sitemap obvykle pohybuje v rozmezí 20–200 URL.
U středně velkého e-shopu lze oddělit produktové, kategoriové, značkové a blogové sitemapy. Aktivní produkty jsou do sitemapu přidány, trvale odstraněné produkty jsou vyřazeny a je na ně nastaveno přesměrování 301 na podobné produkty. Filtrovací URL jsou analyzovány jednotlivě. Filtry s objemem vyhledávání a konverzním potenciálem jsou konfigurovány jako speciální kategorie; ostatní jsou řízeny strategií robots.txt, canonical nebo noindex.
U blogu nebo zpravodajského webu s velkým množstvím obsahu jsou velmi důležitá data publikace, data aktualizace, struktura kategorií a interní prolinkování. Při aktualizaci staršího obsahu by se mělo lastmod správně změnit, ale nemělo by docházet k umělým aktualizacím. Signál, kterému Google důvěřuje, je skutečné vylepšení obsahu.
Často kladené otázky
Zabrání robots.txt úplně indexaci?
Ne. Robots.txt brání procházení, ale ne vždy zcela zabrání indexaci. Pokud na URL odkazují jiné weby, Google ji může zobrazit v indexu, i když ji neprošel. K zamezení indexace je obvykle nutné použít značku noindex nebo vhodné omezení přístupu.
Zajistí soubor Sitemap vyšší pozice v Googlu?
Sitemap přímo negarantuje vyšší pozice. Pomáhá však rychlejšímu objevování důležitých stránek, informuje vyhledávače o aktualizacích a zlepšuje zdraví technického SEO. Pro umístění ve výsledcích je nutná také kvalita obsahu, zpětné odkazy, uživatelský zážitek, rychlost a signály důvěry.
Je povinné uvádět sitemap v souboru robots.txt?
Není to povinné, ale doporučuje se to. Přidání adresy sitemapu do robots.txt umožňuje vyhledávačům snadněji najít vaši mapu stránek. Dobrou praxí je také odeslání sitemapu přes Google Search Console.
Jaká je adresa sitemapu ve WordPressu?
Výchozí adresa WordPress sitemapu je obvykle /wp-sitemap.xml. Pokud používáte SEO pluginy, může být adresa sitemapu /sitemap_index.xml nebo /sitemap.xml. Adresu je třeba zkontrolovat podle toho, jaký plugin používáte.
Kolik URL může být v Sitemapu?
Jeden XML soubor sitemap může obsahovat maximálně 50 000 URL a nesmí překročit limit 50 MB. U větších webů je nejsprávnějším přístupem použít index sitemap a rozdělit obsah do samostatných souborů, jako jsou stránky, příspěvky, produkty, kategorie nebo obrázky.
Závěr
Robots.txt a soubor sitemap jsou dvě zdánlivě malé, ale s velkým dopadem působící základní součásti technického SEO. Zatímco robots.txt usměrňuje chování botů při procházení, sitemap usnadňuje objevování důležitých URL. Pro správnou konfiguraci byste měli ponechat důležité stránky otevřené, kontrolovaně omezit zbytečné oblasti, přidávat do sitemapu pouze indexovatelné URL a pravidelně vše sledovat přes Google Search Console.
Pokud chcete postavit technické základy svého webu na pevných nohou, je dobrým krokem začít se spolehlivým hostingem, správnou správou domény a konfigurací SSL. Prozkoumáním webhosting, doména a SSL certifikát řešení od Hostragons můžete pro svůj web vybudovat rychlou, bezpečnou a SEO-přátelskou infrastrukturu.