Przewodniki krok po kroku

Jak przygotować plik robots.txt i sitemapę? Praktyczny poradnik SEO

Jak przygotować plik robots.txt i sitemapę? Praktyczny poradnik SEO

Plik robots.txt oraz sitemap, czyli mapa witryny, to dwa podstawowe elementy technicznego SEO, które pomagają kontrolować sposób, w jaki wyszukiwarki skanują stronę i odkrywają jej najważniejsze adresy URL. Robots.txt informuje boty, takie jak Googlebot, do których sekcji serwisu mogą zaglądać, a których nie powinny skanować. Sitemap z kolei przekazuje wyszukiwarkom listę istotnych podstron, daty ich aktualizacji oraz ogólną strukturę serwisu. W skrócie: robots.txt porządkuje proces crawlowania, a mapa witryny przyspiesza odkrywanie wartościowych URL-i. Dobrze przygotowane pliki robots.txt i sitemap mogą znacząco poprawić efektywność indeksowania, zwłaszcza w przypadku nowych stron, sklepów internetowych, serwisów firmowych oraz dużych archiwów treści.

W tym poradniku krok po kroku wyjaśniamy, jak przygotować plik robots.txt i sitemapę, jakich reguł używać, na co zwrócić uwagę w WordPressie i w serwisach opartych na autorskim oprogramowaniu, jak testować błędy oraz jak zgłosić mapę witryny do Google. Materiał przygotowany dla bloga Hostragons opiera się na standardach SEO na 2026 rok i koncentruje się na intencji użytkownika, poprawności technicznej, budżecie indeksowania, dostępności do indeksu oraz praktycznych wdrożeniach.

Czym jest robots.txt?

Robots.txt to zwykły plik tekstowy umieszczany w katalogu głównym strony internetowej. Najczęściej jest dostępny pod adresem https://twojadomena.pl/robots.txt. Plik ten przekazuje robotom wyszukiwarek wskazówki dotyczące tego, które foldery lub strony mogą być skanowane, a których boty nie powinny odwiedzać. Najważniejsze jest jednak to, że robots.txt nie jest narzędziem bezpieczeństwa. To jedynie instrukcja dla botów, które respektują dobre praktyki indeksowania.

Przykładowo można zablokować skanowanie panelu administracyjnego, etapów koszyka, parametrów filtrów, wewnętrznych wyników wyszukiwania czy katalogów testowych. Nie wolno jednak traktować robots.txt jako sposobu na ochronę poufnych danych. Plik jest publicznie widoczny dla każdego. Do realnego zabezpieczenia danych potrzebna jest ochrona hasłem, ograniczenia dostępu po stronie serwera, bezpieczna konfiguracja hostingu oraz certyfikat SSL. W kontekście podstawowego bezpieczeństwa strony warto rozważyć Certyfikat SSL, a dla stabilnej i wydajnej infrastruktury także rozwiązania Hosting WWW.

Do czego służy plik robots.txt?

  • Kieruje zachowaniem robotów wyszukiwarek podczas skanowania strony.
  • Ogranicza crawlowanie mało istotnych lub powielonych podstron.
  • Pomaga przeznaczyć budżet indeksowania na najważniejsze adresy URL.
  • Wskazuje botom lokalizację pliku mapy witryny.
  • Może blokować skanowanie obszarów takich jak środowiska testowe, panele, wyszukiwarka wewnętrzna czy adresy z parametrami.

W serwisach posiadających tysiące produktów, kategorii, tagów lub stron z filtrami źle przygotowany robots.txt może sprawić, że Google późno odkryje ważne podstrony. Z drugiej strony zbyt restrykcyjny plik może przypadkowo zablokować CSS, JavaScript, grafiki albo strony kategorii, co negatywnie wpłynie na widoczność i ocenę jakości strony w wynikach wyszukiwania.

Czym jest sitemap?

Sitemap, czyli mapa witryny, to plik w formacie XML, który zawiera listę ważnych adresów URL znajdujących się w serwisie. Zwykle jest dostępny pod adresem https://twojadomena.pl/sitemap.xml. Mapa witryny komunikuje wyszukiwarkom: te strony są dla mnie istotne, proszę je odkryć i — jeśli spełniają wymagania jakościowe — uwzględnić w procesie indeksowania.

W pliku sitemap mogą znajdować się informacje takie jak adres URL, data ostatniej aktualizacji, częstotliwość zmian czy priorytet. W podejściu SEO na 2026 rok szczególnie duże znaczenie ma data ostatniej aktualizacji. Wyszukiwarki chcą bowiem sprawnie odkrywać świeże, wartościowe i aktualizowane treści. Trzeba jednak pamiętać, że sama mapa witryny nie daje gwarancji indeksacji. To, że dany URL znajduje się w sitemapie, nie oznacza automatycznie, że zostanie pokazany w Google. Strona musi być jakościowa, dostępna, możliwa do zaindeksowania, poprawnie oznaczona kanonicznie oraz zgodna z intencją użytkownika.

Kiedy mapa witryny jest potrzebna?

  • Gdy masz nowo uruchomioną stronę internetową.
  • Gdy serwis zawiera wiele podstron, produktów lub wpisów blogowych.
  • Gdy struktura linkowania wewnętrznego jest słaba lub nierównomierna.
  • Gdy publikujesz dużo treści graficznych, wideo albo newsowych.
  • Gdy w sklepie internetowym często aktualizujesz produkty.
  • Gdy regularnie odświeżasz starsze treści.

Nawet w małej stronie z poprawnym linkowaniem wewnętrznym stosowanie mapy witryny jest dobrą praktyką. Sitemap przekazuje wyszukiwarkom uporządkowaną listę adresów URL i zmniejsza ryzyko opóźnień w odkrywaniu nowych lub zaktualizowanych podstron.

Różnice między robots.txt a sitemapą

Robots.txt i sitemap działają razem, ale pełnią różne funkcje. Robots.txt odpowiada przede wszystkim za instrukcje dotyczące skanowania i ograniczeń, natomiast sitemap wskazuje adresy URL, które chcesz pokazać wyszukiwarkom jako istotne. Poniższa tabela podsumowuje najważniejsze różnice.

Różnice między robots.txt a sitemapą
CechaRobots.txtSitemap
Główny celKierowanie botami, które obszary strony mają skanowaćZgłaszanie wyszukiwarkom ważnych adresów URL
Lokalizacja plikuKatalog główny: /robots.txtNajczęściej /sitemap.xml
FormatZwykły tekstXML
Czy daje gwarancję indeksacji?NieNie
Ryzyko błędnego użyciaMoże zablokować skanowanie ważnych podstronMoże wysyłać niskiej jakości URL-e albo strony z noindex
Wpływ na SEOPomaga zarządzać budżetem indeksowaniaWzmacnia odkrywanie URL-i i sygnały aktualizacji

Jak przygotować plik robots.txt?

Przygotowanie pliku robots.txt jest technicznie proste, ale z punktu widzenia SEO wymaga ostrożności. Nazwa pliku musi brzmieć dokładnie robots.txt, małymi literami, a sam plik powinien zostać umieszczony w katalogu głównym domeny. Poprawny adres to https://twojadomena.pl/robots.txt. Plik robots.txt umieszczony w podfolderze nie będzie traktowany jako właściwy plik sterujący skanowaniem całej witryny.

1. Utwórz podstawową strukturę robots.txt

Najprostsza konfiguracja pozwala wszystkim botom skanować witrynę i jednocześnie wskazuje lokalizację mapy strony:

  • User-agent: *
  • Allow: /
  • Sitemap: https://twojadomena.pl/sitemap.xml

W tym przykładzie User-agent: * oznacza wszystkie boty. Allow: / zezwala na skanowanie całej strony. Linia Sitemap wskazuje adres mapy witryny. Dla nowej strony, którą chcesz zaindeksować w wyszukiwarce, taka konfiguracja jest zwykle bezpiecznym punktem startowym.

2. Określ obszary, których nie chcesz skanować

Nie każda podstrona powinna być skanowana przez roboty. Szczególnie strony tymczasowe, prywatne, powtarzalne, zależne od użytkownika lub o niskiej wartości SEO można ograniczyć w robots.txt. Przykładowe reguły:

  • Disallow: /wp-admin/
  • Disallow: /koszyk/
  • Disallow: /platnosc/
  • Disallow: /szukaj/
  • Disallow: /test/

W witrynach WordPress często blokuje się skanowanie katalogu /wp-admin/. Jednocześnie niektóre funkcje WordPressa, motywów i wtyczek wymagają dostępu do pliku /wp-admin/admin-ajax.php. Dlatego przykładowa konfiguracja dla WordPressa może wyglądać następująco:

  • User-agent: *
  • Disallow: /wp-admin/
  • Allow: /wp-admin/admin-ajax.php
  • Sitemap: https://twojadomena.pl/sitemap.xml

W tym wariancie panel administracyjny jest zamknięty dla skanowania, ale operacje AJAX potrzebne motywom i wtyczkom pozostają dostępne. Jeśli chcesz, aby Twoja strona na WordPressie działała szybciej i stabilniej, warto sprawdzić również usługi Hosting WordPress.

3. Kontroluj parametry i filtry w sklepach internetowych

W e-commerce filtrowanie, sortowanie, kolor, rozmiar, zakres cen, dostępność produktów i parametry wyszukiwania mogą generować ogromną liczbę adresów URL. Ta sama kategoria może na przykład występować w wariantach: /buty?kolor=czarny, /buty?rozmiar=42, /buty?sort=price_asc. Jeśli taka struktura nie zostanie opanowana, Googlebot może marnować czas na tysiące niskowartościowych stron parametrycznych.

W takich przypadkach robots.txt należy analizować razem z tagami canonical oraz danymi z Google Search Console. Samo zablokowanie wszystkich parametrów w robots.txt nie zawsze jest najlepszym rozwiązaniem. Niektóre strony z filtrami mogą mieć wyraźną intencję zakupową i potencjał SEO. Przykładowo kategoria typu czarne męskie buty sportowe może być wartościową frazą i powinna zostać zaplanowana jako osobna, indeksowalna strona kategorii.

4. Nie blokuj plików CSS i JavaScript

We współczesnym SEO Google nie ocenia stron wyłącznie po surowym kodzie HTML, ale także po wyrenderowanej wersji widocznej dla użytkownika. Blokowanie plików CSS i JavaScript może utrudnić Google zrozumienie układu strony, wersji mobilnej, menu, elementów interaktywnych czy sposobu ładowania treści. Reguły stosowane kiedyś, takie jak Disallow: /assets/ lub Disallow: /js/, są dziś ryzykowne, jeśli obejmują zasoby potrzebne do prawidłowego renderowania strony.

Bezpieczne podejście na 2026 rok jest proste: zasoby budujące doświadczenie użytkownika, czyli CSS, JS, grafiki i fonty, powinny być dostępne dla botów. Ograniczać należy wyłącznie te katalogi, które rzeczywiście nie powinny być skanowane, na przykład administracyjne, tymczasowe albo prywatne.

5. Przetestuj plik robots.txt

Po wgraniu pliku koniecznie go sprawdź. Weryfikacji wymagają przede wszystkim:

  • Czy adres https://twojadomena.pl/robots.txt otwiera się z kodem statusu 200?
  • Czy plik nie jest pusty, błędny albo przypisany do niewłaściwej domeny?
  • Czy linia Sitemap wskazuje poprawny adres mapy witryny?
  • Czy ważne kategorie, produkty, usługi i wpisy blogowe nie zostały zablokowane?
  • Czy zasoby CSS, JS i grafiki nie są przypadkowo niedostępne dla botów?

Za pomocą narzędzia Inspekcja adresu URL w Google Search Console możesz sprawdzić, czy kluczowe podstrony są możliwe do zeskanowania. Analiza logów serwera, pokazująca, które adresy odwiedza Googlebot, jest bardziej zaawansowaną, ale bardzo wartościową metodą. Dla mocnej wydajności serwera i prawidłowej konfiguracji warto rozważyć Serwer VPS albo Hosting dla firm.

Jak przygotować plik sitemap?

Tworząc sitemapę, celem jest przekazanie wyszukiwarkom czystej listy wartościowych adresów URL, które rzeczywiście powinny trafić do indeksu. Nie każdy adres w serwisie musi znaleźć się w mapie witryny. Wręcz przeciwnie: dodawanie stron z noindex, przekierowań, błędów lub duplikatów może wysyłać niekorzystne sygnały SEO.

1. Dodawaj tylko indeksowalne adresy URL

Strony umieszczane w sitemapie powinny spełniać następujące kryteria:

  • Zwracać kod statusu 200.
  • Nie zawierać tagu noindex.
  • Nie być zablokowane przez robots.txt.
  • Mieć tag kanoniczny wskazujący na siebie lub na właściwy docelowy adres.
  • Zawierać unikalną treść, która daje użytkownikowi realną wartość.
  • Być responsywne i ładować się szybko na urządzeniach mobilnych.

Na przykład usunięte strony produktów, produkty trwale wycofane ze sprzedaży, wewnętrzne wyniki wyszukiwania, koszyk i strony płatności nie powinny znajdować się w sitemapie. Do mapy witryny warto natomiast dodawać główne kategorie, ważne podkategorie, strony usług, wpisy blogowe oraz aktywne produkty.

2. Poprawnie używaj formatu XML sitemap

Prosta struktura XML sitemap opiera się na następującej logice:

  • <urlset> jest głównym kontenerem pliku.
  • <url> to osobny blok dla każdej strony.
  • <loc> zawiera pełny adres URL podstrony.
  • <lastmod> wskazuje datę ostatniej aktualizacji strony.

Przykładowy wpis URL można wyobrazić sobie tak: <loc>https://twojadomena.pl/uslugi/</loc> oraz <lastmod>2026-01-15</lastmod>. Zalecany format daty to rok-miesiąc-dzień. Ważne jest, aby pole lastmod było aktualizowane automatycznie i zgodnie z rzeczywistymi zmianami. Codzienne zmienianie dat wszystkich URL-i tylko po to, aby „pobudzić” Google, nie jest wiarygodną ani dobrą praktyką.

3. W dużych serwisach podziel sitemapę na sekcje

Standardowy plik XML sitemap powinien zawierać maksymalnie 50 000 adresów URL i nie przekraczać 50 MB w wersji nieskompresowanej. W dużych serwisach lepszym rozwiązaniem jest użycie indeksu map witryny zamiast jednego ogromnego pliku. Przykładowa struktura:

  • /post-sitemap.xml
  • /page-sitemap.xml
  • /product-sitemap.xml
  • /category-sitemap.xml
  • /image-sitemap.xml

Taki podział ułatwia wyszukiwarkom przetwarzanie plików, a Tobie pomaga analizować, w którym typie treści pojawiają się problemy z indeksacją. Jeśli na przykład w sitemapie produktów znajduje się 20 000 URL-i, a zaindeksowanych jest tylko 8 000, warto osobno zbadać opisy produktów, dostępność magazynową, duplikaty treści, szybkość ładowania oraz strukturę filtrów.

4. Tworzenie mapy witryny w WordPressie

WordPress od wersji 5.5 ma wbudowaną funkcję XML sitemap. Domyślnie mapa jest dostępna pod adresem /wp-sitemap.xml. W wielu profesjonalnych projektach częściej używa się jednak wtyczek SEO, takich jak Rank Math, Yoast SEO lub podobnych narzędzi, ponieważ dają one większą kontrolę nad mapą witryny. Dzięki nim można określić, które typy treści mają trafić do sitemap, czy archiwa tagów powinny być pokazywane oraz jak zarządzać archiwami autorów.

Częstym błędem w WordPressie jest dodawanie do mapy witryny niskiej jakości stron tagów. Jeśli strony tagów nie mają unikalnych opisów, sensownego linkowania wewnętrznego i realnego popytu w wyszukiwarce, zwykle lepiej wykluczyć je z sitemap. Aby wzmocnić strategię treści, możesz też odwołać się do tematu jak pisać artykuł blogowy zgodny z SEO.

5. Zautomatyzuj sitemapę w serwisach autorskich

W stronach opartych na dedykowanym oprogramowaniu mapę witryny można przygotować ręcznie, ale w projektach dynamicznych konieczna jest automatyzacja. Gdy dodajesz produkt, publikujesz wpis blogowy lub aktualizujesz stronę usługi, sitemap powinna zaktualizować się automatycznie. Zespół developerski powinien wdrożyć następujące zasady:

  • Opublikowane strony powinny automatycznie trafiać do sitemap.
  • Usunięte adresy oraz URL-e zwracające 404 powinny być usuwane z mapy witryny.
  • Strony oznaczone noindex nie powinny być dodawane do sitemap.
  • Strony z innym adresem kanonicznym muszą być zarządzane ostrożnie.
  • Lastmod powinien zmieniać się wyłącznie po realnej aktualizacji treści.

Taka automatyzacja ma kluczowe znaczenie dla zdrowia technicznego SEO, szczególnie w często aktualizowanych serwisach newsowych, ogłoszeniowych, rezerwacyjnych, edukacyjnych oraz w sklepach internetowych.

Jak wskazać sitemapę w pliku robots.txt?

Dodanie adresu mapy witryny na końcu pliku robots.txt to dobra praktyka. Dzięki temu boty mogą łatwiej znaleźć sitemapę. Przykład użycia:

  • User-agent: *
  • Allow: /
  • Sitemap: https://twojadomena.pl/sitemap.xml

Jeśli masz kilka plików sitemap, możesz wskazać każdy z nich w osobnej linii:

  • Sitemap: https://twojadomena.pl/post-sitemap.xml
  • Sitemap: https://twojadomena.pl/product-sitemap.xml
  • Sitemap: https://twojadomena.pl/category-sitemap.xml

Jeżeli domena działa po HTTPS, adresy sitemap również powinny używać HTTPS. Nie należy mieszać wariantów HTTP, www i non-www. Dlatego struktura domeny, certyfikat SSL i przekierowania powinny być zaplanowane poprawnie od samego początku. Jeśli uruchamiasz nowy projekt, potraktuj Sprawdzanie domen oraz Certyfikat SSL jako elementy tego samego planu technicznego SEO.

Jak zgłosić sitemapę do Google Search Console?

Jak zgłosić sitemapę do Google Search Console?

Po utworzeniu mapy witryny warto zgłosić ją w Google Search Console. Kroki są następujące:

  • Zaloguj się do Google Search Console.
  • Wybierz właściwą usługę. Najlepiej używać usługi typu domena.
  • W menu po lewej stronie przejdź do sekcji Mapy witryn.
  • Wpisz adres sitemap, na przykład sitemap.xml.
  • Kliknij przycisk Prześlij.
  • W sekcji statusu sprawdź informację o powodzeniu oraz liczbę wykrytych adresów URL.

Po zgłoszeniu sitemap nie oczekuj, że wszystkie strony natychmiast trafią do indeksu. Google najpierw odkrywa adresy, następnie je skanuje, przetwarza i dopiero na podstawie sygnałów jakości decyduje, czy je zaindeksować. W przypadku nowych stron proces może potrwać od kilku dni do kilku tygodni. Mocne linkowanie wewnętrzne, wartościowa treść i szybka odpowiedź serwera pozytywnie wpływają na tempo tego procesu.

Najczęstsze błędy w robots.txt i sitemapie

1. Przypadkowe zablokowanie całej strony

Najpoważniejszym błędem jest pozostawienie reguły Disallow: / na działającej stronie. Taka reguła blokuje skanowanie całej witryny. Ustawienie często używane w środowisku testowym, jeśli nie zostanie usunięte podczas publikacji, uniemożliwi Google skanowanie nowych podstron. Robots.txt powinien obowiązkowo znaleźć się na liście kontrolnej przed wdrożeniem strony na produkcję.

2. Dodawanie stron noindex do mapy witryny

Oznaczenie strony jako noindex i jednoczesne dodanie jej do sitemap tworzy sprzeczny sygnał. Mapa witryny mówi: ta strona jest ważna, a noindex mówi: nie indeksuj tej strony. Dlatego sitemap powinna zawierać wyłącznie adresy URL, które faktycznie mają być indeksowane.

3. Trzymanie w sitemapie adresów zwracających 301, 404 lub 500

Adresy URL w mapie witryny powinny idealnie zwracać kod statusu 200. URL-e przekierowane, nieistniejące lub generujące błędy serwera należy regularnie usuwać. Comiesięczny techniczny audyt SEO pomaga wykryć takie problemy, zanim zaczną negatywnie wpływać na crawlowanie i indeksację.

4. Używanie niewłaściwej domeny lub protokołu

Jeśli korzystasz z formatu https://www.twojadomena.pl, adresy w sitemapie również powinny mieć dokładnie taki sam format. Inny protokół lub inny wariant domeny może utrudnić Google łączenie sygnałów. Dlatego canonical, sitemap, robots.txt i przekierowania powinny konsekwentnie wskazywać ten sam główny format adresów URL.

5. Wysyłanie zbyt wielu adresów URL

Sitemap nie jest koszem na wszystkie możliwe linki. Zamiast dodawać każdy URL, umieszczaj w niej te strony, które naprawdę chcesz indeksować i które mają odpowiednią jakość. Wykluczenie słabych, zduplikowanych lub cienkich treści z mapy witryny wysyła wyszukiwarkom czystszy i bardziej spójny sygnał.

Techniczna lista kontrolna SEO na 2026 rok

Podczas przygotowywania plików robots.txt i sitemap możesz skorzystać z poniższej listy kontrolnej:

  • Czy robots.txt znajduje się w katalogu głównym i jest dostępny?
  • Czy adres sitemap jest poprawnie wskazany w pliku robots.txt?
  • Czy ważne podstrony nie są blokowane przez robots.txt?
  • Czy CSS, JavaScript i zasoby graficzne są możliwe do skanowania?
  • Czy sitemap zawiera wyłącznie indeksowalne adresy URL zwracające kod 200?
  • Czy strony noindex zostały wykluczone z mapy witryny?
  • Czy daty lastmod odzwierciedlają rzeczywiste aktualizacje?
  • Czy w dużych serwisach używany jest indeks map witryny?
  • Czy sitemap została poprawnie przetworzona w Google Search Console?
  • Czy czas odpowiedzi serwera wspiera efektywne skanowanie strony?

Techniczne SEO nie kończy się na utworzeniu dwóch plików. Wydajność hostingu, konfiguracja SSL, poprawność DNS, przekierowania, responsywność i jakość treści również mają bezpośrednie znaczenie. Dlatego planując infrastrukturę projektu, warto rozważyć razem Pakiety hostingu, Transfer domen oraz Bezpieczeństwo strony internetowej.

Przykładowa strategia robots.txt i sitemap

Dla prostej strony firmowej rekomendowana struktura może wyglądać następująco: strona główna, strony usług, o nas, kontakt i wpisy blogowe trafiają do sitemap. Panel administracyjny, strony podziękowania po formularzu, tymczasowe testy kampanii i wewnętrzne wyniki wyszukiwania są zarządzane przez robots.txt lub noindex. W takim serwisie mapa witryny najczęściej zawiera od 20 do 200 adresów URL.

W średniej wielkości sklepie internetowym warto oddzielić sitemapę produktów, kategorii, marek i bloga. Aktywne produkty są dodawane do mapy witryny, trwale wycofane produkty są usuwane, a ich adresy w razie potrzeby przekierowywane 301 do podobnych produktów lub kategorii. URL-e filtrów analizuje się indywidualnie. Filtry z wolumenem wyszukiwań i potencjałem konwersji można przekształcić w dedykowane kategorie, a pozostałe kontrolować za pomocą robots.txt, canonical lub noindex.

W blogu z dużą liczbą treści albo w serwisie informacyjnym ogromne znaczenie mają daty publikacji, daty aktualizacji, struktura kategorii oraz linkowanie wewnętrzne. Gdy starsze treści są aktualizowane, pole lastmod powinno zmienić się poprawnie, ale nie należy wykonywać sztucznych aktualizacji bez realnej poprawy treści. Sygnałem, któremu Google może zaufać, jest rzeczywiste ulepszenie materiału, a nie sama zmiana daty.

Najczęściej zadawane pytania

Czy plik robots.txt całkowicie blokuje indeksowanie?

Nie. Robots.txt blokuje skanowanie, ale nie zawsze całkowicie uniemożliwia indeksowanie. Jeśli dany URL ma linki z innych stron, Google może pokazać go w indeksie nawet bez zeskanowania zawartości. Aby uniemożliwić indeksowanie, zwykle stosuje się tag noindex lub odpowiednie ograniczenia dostępu.

Czy sitemap pomaga osiągnąć wyższe pozycje w Google?

Sitemap nie daje bezpośredniej gwarancji lepszych pozycji. Pomaga jednak szybciej odkrywać ważne podstrony, przekazywać informacje o aktualizacjach i poprawiać ogólną kondycję technicznego SEO. Do wzrostu pozycji potrzebne są również jakość treści, linki, doświadczenie użytkownika, szybkość działania i sygnały zaufania.

Czy trzeba podawać sitemapę w pliku robots.txt?

Nie jest to obowiązkowe, ale zdecydowanie zalecane. Dodanie adresu sitemap do robots.txt ułatwia wyszukiwarkom odnalezienie mapy witryny. Dobrą praktyką jest także zgłoszenie sitemap przez Google Search Console.

Jaki jest adres sitemap w WordPressie?

Domyślny adres mapy witryny w WordPressie to zazwyczaj /wp-sitemap.xml. Jeśli korzystasz z wtyczek SEO, adres może mieć postać /sitemap_index.xml albo /sitemap.xml. Warto sprawdzić dokładny adres w ustawieniach używanej wtyczki.

Ile adresów URL może zawierać sitemap?

Jeden plik XML sitemap może zawierać maksymalnie 50 000 adresów URL i nie powinien przekraczać limitu 50 MB. W większych serwisach najlepszym podejściem jest użycie indeksu map witryny i podział treści na osobne pliki, na przykład dla stron, wpisów, produktów, kategorii lub grafik.

Podsumowanie

Robots.txt i sitemap to dwa elementy technicznego SEO, które wyglądają niepozornie, ale mogą mieć duży wpływ na widoczność strony. Robots.txt kieruje zachowaniem botów podczas skanowania, a mapa witryny ułatwia odkrywanie ważnych adresów URL. Aby konfiguracja była poprawna, należy pozostawić dostęp do kluczowych podstron, rozsądnie ograniczyć niepotrzebne obszary, dodawać do sitemap wyłącznie indeksowalne adresy i regularnie monitorować sytuację w Google Search Console.

Jeśli chcesz zbudować solidne techniczne fundamenty swojej strony, zacznij od niezawodnego hostingu, właściwego zarządzania domeną i poprawnej konfiguracji SSL. Sprawdź rozwiązania Hostragons: Hosting WWW, domena oraz Certyfikat SSL, aby stworzyć szybką, bezpieczną i przyjazną SEO infrastrukturę dla swojej witryny.

Udostępnij ten artykuł:
Alihan Yıldırım

Specjalista ds. Wydajności Stron Internetowych

Posiada ponad 10-letnie doświadczenie w analizie wydajności stron internetowych i optymalizacji szybkości. Pracuje nad systemami CDN i cache.

Wszystkie artykuły →