Посібники

Як створити robots.txt та sitemap (карту сайту) для ідеального SEO

Як створити robots.txt та sitemap (карту сайту) для ідеального SEO

Robots.txt та sitemap — це два базові технічні файли, які керують тим, як пошукові системи сканують ваш вебсайт і які сторінки вони знаходять. Robots.txt вказує ботам на кшталт Googlebot, до яких розділів сайту можна заходити, а до яких — ні. Sitemap, або карта сайту, натомість повідомляє пошуковикам про важливі URL-адреси, дати їх оновлення та загальну структуру ресурсу. Якщо коротко: robots.txt керує скануванням, а sitemap пришвидшує індексацію. Грамотно налаштовані robots.txt і sitemap суттєво підвищують ефективність індексації — особливо для нових проєктів, інтернет-магазинів, корпоративних сайтів і великих контентних архівів.

У цьому посібнику ми покроково розберемо, як створити robots.txt та sitemap, які правила використовувати, на що звернути увагу на WordPress та самописних сайтах, як тестувати помилки та як надіслати файли до Google. Цей матеріал, підготовлений для блогу Hostragons, враховує стандарти SEO 2026 року та орієнтований на користувацький намір, технічну точність, бюджет сканування, індексабельність і практичне застосування.

Що таке robots.txt?

Robots.txt — це звичайний текстовий файл, який знаходиться в кореневому каталозі вашого сайту. Зазвичай він доступний за адресою https://vashdomen.com/robots.txt. Цей файл дає вказівки пошуковим ботам, які папки чи сторінки їм дозволено сканувати, а які — ні. Ключовий момент: robots.txt — це не інструмент безпеки. Це лише рекомендація щодо сканування для добросовісних ботів.

Наприклад, адмінпанель, сторінки кошика, параметри фільтрів, результати внутрішнього пошуку або тестові директорії можна закрити від сканування. Однак приховати конфіденційну інформацію за допомогою robots.txt неможливо, адже файл доступний для перегляду будь-кому. Для реального захисту потрібен пароль, обмеження доступу на рівні сервера, безпечне хостингове середовище та SSL-сертифікат. Саме тут варто розглянути SSL сертифікат для базової безпеки та веб хостинг для продуктивної інфраструктури.

Для чого потрібен файл robots.txt?

  • Керує поведінкою пошукових ботів під час сканування.
  • Зменшує сканування неважливих або дубльованих сторінок.
  • Допомагає спрямувати бюджет сканування на пріоритетні сторінки.
  • Повідомляє ботам розташування файлу sitemap.
  • Може заблокувати сканування тестових розділів, адмінпанелі, результатів пошуку та URL-адрес із параметрами.

Особливо критично це для сайтів із тисячами товарів, категорій, тегів або сторінок фільтрів. Якщо robots.txt налаштовано неправильно, Google може запізно виявити важливі сторінки. І навпаки, надто суворі обмеження можуть заблокувати CSS, JavaScript, зображення або сторінки категорій, що негативно вплине на позиції.

Що таке Sitemap (карта сайту)?

Sitemap, або карта сайту, — це файл у форматі XML, який надає пошуковим системам список важливих URL-адрес вашого вебсайту. Зазвичай він розташований за адресою https://vashdomen.com/sitemap.xml. Sitemap надсилає пошуковикам сигнал: «Ці сторінки для мене важливі, будь ласка, знайдіть їх і включіть відповідні до процесу індексації».

Файл sitemap може містити URL-адресу, дату останнього оновлення, частоту змін і пріоритетність. У підходах SEO 2026 року особливої ваги набуває дата останнього оновлення, адже пошукові системи прагнуть швидше знаходити свіжий і якісний контент. Втім, sitemap сам по собі не гарантує індексації. Наявність URL-адреси в карті сайту не означає, що сторінка обов'язково з'явиться у видачі Google. Сторінка має бути якісною, доступною, індексабельною, з правильно налаштованим канонічним тегом і відповідати намірам користувача.

Коли потрібен файл sitemap?

  • Якщо у вас щойно запущений вебсайт.
  • Якщо у вас велика кількість сторінок, товарів або публікацій у блозі.
  • Якщо внутрішня перелінковка сайту слабка.
  • Якщо у вас багато зображень, відео або новинного контенту.
  • Якщо в інтернет-магазині часто оновлюються товари.
  • Якщо ви регулярно оновлюєте застарілий контент.

Навіть для невеликого сайту з хорошою структурою внутрішніх посилань використання sitemap є гарною практикою. Карта сайту надає пошуковим системам чіткий перелік URL-адрес і зменшує ймовірність затримок у їх виявленні.

Відмінності між robots.txt і sitemap

Хоча robots.txt і sitemap працюють у парі, їхні завдання різні. Robots.txt здебільшого відповідає за дозволи та обмеження сканування, тоді як sitemap перераховує URL-адреси, які ви хочете, щоб знайшли. У таблиці нижче підсумовано ключові відмінності.

Відмінності між robots.txt і sitemap
ХарактеристикаRobots.txtSitemap
Основна метаКерувати тим, які розділи сканують ботиПовідомляти пошукові системи про важливі URL-адреси
Розташування файлуКореневий каталог: /robots.txtЗазвичай /sitemap.xml
ФорматЗвичайний текстXML
Чи гарантує індексацію?НіНі
Ризик неправильного використанняМоже закрити від сканування важливі сторінкиМоже надсилати неякісні або noindex сторінки
Вплив на SEOДопомагає керувати бюджетом скануванняПідсилює сигнал виявлення URL-адрес і оновлень

Як створити файл robots.txt?

Створити файл robots.txt технічно просто, але з точки зору SEO це вимагає уваги. Файл має називатися robots.txt малими літерами і бути завантаженим у кореневий каталог сайту. Тобто правильна адреса — https://vashdomen.com/robots.txt. Файл robots.txt, завантажений у підпапку, не буде дійсним.

1. Створіть базову структуру robots.txt

Найпростіша структура дозволяє всім ботам сканувати сайт і повідомляє розташування sitemap:

  • User-agent: *
  • Allow: /
  • Sitemap: https://vashdomen.com/sitemap.xml

Тут User-agent: * означає всіх ботів. Allow: / дозволяє сканування всього сайту. Рядок Sitemap вказує розташування карти сайту. Для нового сайту, який ви хочете проіндексувати, така структура зазвичай є безпечним стартом.

2. Визначте розділи, які не потрібно сканувати

Не кожну сторінку потрібно сканувати. Особливо це стосується персональних, тимчасових, дубльованих або сторінок із низькою SEO-цінністю — їх можна обмежити через robots.txt. Наприклад:

  • Disallow: /wp-admin/
  • Disallow: /koshyk/
  • Disallow: /oplata/
  • Disallow: /poshuk/
  • Disallow: /test/

На сайтах WordPress закриття папки /wp-admin/ від сканування є поширеною практикою. Однак для коректної роботи деяких AJAX-файлів WordPress необхідно дозволити доступ до /wp-admin/admin-ajax.php. Тому приклад для WordPress може виглядати так:

  • User-agent: *
  • Disallow: /wp-admin/
  • Allow: /wp-admin/admin-ajax.php
  • Sitemap: https://vashdomen.com/sitemap.xml

У цьому прикладі адмінпанель закривається для сканування, але дозволяються AJAX-запити, необхідні для роботи тем і плагінів. Щоб ваш сайт на WordPress працював швидше та стабільніше, ви можете розглянути послуги WordPress хостинг.

3. Контролюйте параметри та фільтри для інтернет-магазинів

В інтернет-магазинах фільтрація, сортування, вибір кольору, розміру, цінового діапазону, наявності та пошукові параметри можуть генерувати безліч URL-адрес. Наприклад, одна категорія може множитися в таких варіаціях: /vzuttya?kolir=chorniy, /vzuttya?rozmir=42, /vzuttya?sort=price_asc. Якщо цю структуру не контролювати, боти Google можуть сканувати тисячі малоцінних параметризованих сторінок.

Для таких випадків слід комплексно оцінювати robots.txt, канонічні теги та дані Google Search Console. Просте закриття всіх параметрів через robots.txt не завжди є правильним рішенням, адже деякі сторінки фільтрів можуть мати комерційний пошуковий намір. Наприклад, якщо категорія «чорні чоловічі спортивні кросівки» має SEO-цінність, її варто оформити як окрему індексабельну сторінку категорії.

4. Не блокуйте файли CSS і JavaScript

У сучасному SEO Google оцінює сторінки не лише як HTML-код, а й у відрендереному вигляді. Тому блокування CSS і JavaScript може ускладнити для Google розуміння макета сторінки, мобільної адаптивності, меню або структури завантаження контенту. Застарілі правила на кшталт Disallow: /assets/ або Disallow: /js/ сьогодні є ризикованими.

Безпечний підхід на 2026 рік такий: CSS, JS, файли зображень і шрифтів, які формують користувацький досвід, мають бути відкриті для ботів. Обмежувати слід лише ті директорії, які дійсно не потребують сканування: адміністративні, тимчасові або приватні.

5. Протестуйте файл robots.txt

Після завантаження файлу обов'язково протестуйте його. Ось що потрібно перевірити:

  • Чи відкривається адреса https://vashdomen.com/robots.txt з кодом статусу 200?
  • Чи не є файл порожнім, помилковим або призначеним для іншого домену?
  • Чи вказує рядок Sitemap на правильну URL-адресу?
  • Чи не заблоковані важливі сторінки категорій, товарів, послуг і блогу?
  • Чи не закриті помилково ресурси CSS, JS і зображення?

За допомогою інструмента перевірки URL у Google Search Console ви можете перевірити, чи доступні важливі сторінки для сканування. Аналіз логів сервера щодо того, які URL-адреси відвідує Googlebot, є просунутим, але дуже цінним методом. Для потужної продуктивності сервера та правильного налаштування можна розглянути VPS сервер або корпоративний хостинг.

Як створити файл sitemap?

Мета створення sitemap — надати пошуковим системам чистий список якісних URL-адрес, які ви хочете проіндексувати. Не кожна URL-адреса має бути в карті сайту. Більше того, додавання до sitemap сторінок із тегом noindex, перенаправленням, помилками або дубльованим контентом може створити негативний сигнал для SEO.

1. Додавайте лише індексабельні URL-адреси

Сторінки, які ви додаєте до sitemap, повинні відповідати таким критеріям:

  • Повертати код статусу 200.
  • Не містити тег noindex.
  • Не бути заблокованими у файлі robots.txt.
  • Мати канонічний тег, що вказує на саму сторінку або правильну цільову адресу.
  • Містити унікальний контент, цінний для користувача.
  • Бути мобільними та швидко завантажуватися.

Наприклад, видалені сторінки товарів, товари, яких немає в наявності та які були остаточно прибрані, результати внутрішнього пошуку, сторінки кошика й оплати не повинні бути присутніми в sitemap. Натомість основні сторінки категорій, важливі підкатегорії, сторінки послуг, публікації блогу та активні товари слід включити до карти сайту.

2. Використовуйте правильний формат XML Sitemap

Проста структура XML sitemap будується за такою логікою:

  • <urlset> є головним контейнером.
  • <url> — це окремий блок для кожної сторінки.
  • <loc> містить повну URL-адресу сторінки.
  • <lastmod> вказує дату останнього оновлення сторінки.

Приклад запису URL-адреси може виглядати так: <loc>https://vashdomen.com/poslugy/</loc> і <lastmod>2026-01-15</lastmod>. Рекомендується використовувати формат дати рік-місяць-день. Важливо автоматично й коректно оновлювати поле lastmod. Штучне оновлення дати для всіх URL-адрес щодня лише для того, щоб «підштовхнути» Google, не є надійною практикою.

3. Розділяйте sitemap на частини для великих сайтів

Стандартний файл XML sitemap повинен містити не більше 50 000 URL-адрес, а його розмір у нестисненому вигляді не має перевищувати 50 МБ. Для великих сайтів краще використовувати індекс sitemap замість одного файлу. Наприклад:

  • /post-sitemap.xml
  • /page-sitemap.xml
  • /product-sitemap.xml
  • /category-sitemap.xml
  • /image-sitemap.xml

Така структура дозволяє пошуковим системам ефективніше обробляти файли та полегшує аналіз того, з яким типом контенту виникли проблеми індексації. Наприклад, якщо з 20 000 URL-адрес у товарному sitemap проіндексовано лише 8 000, варто окремо дослідити описи товарів, статус наявності, дубльований контент, швидкість сторінок або структуру фільтрів.

4. Створення sitemap у WordPress

WordPress версії 5.5 і новіших мають вбудовану функцію XML sitemap. За замовчуванням вона доступна за адресою /wp-sitemap.xml. Однак у багатьох професійних проєктах надають перевагу SEO-плагінам, таким як Rank Math, Yoast SEO або подібним, оскільки вони пропонують розширені можливості керування sitemap. За допомогою цих плагінів можна визначити, які типи контенту включати до sitemap, чи показувати архіви тегів і як керувати архівами авторів.

Поширена помилка на сайтах WordPress — додавання до sitemap малоцінних сторінок тегів. Якщо сторінки тегів не мають унікального опису, сильної внутрішньої перелінковки та реального пошукового попиту, їх краще залишити поза картою сайту. Щоб посилити вашу контент-стратегію, ви можете також звернутися до теми як написати SEO-оптимізовану статтю для блогу.

5. Налаштуйте автоматизацію sitemap для самописних сайтів

Для сайтів на самописному програмному забезпеченні sitemap можна створити вручну, але для динамічних проєктів необхідна автоматична генерація. Коли додається товар, публікується стаття в блозі або оновлюється сторінка послуги, sitemap має оновлюватися автоматично. Рекомендується, щоб команда розробників дотримувалася таких правил:

  • Опубліковані сторінки автоматично додаються до sitemap.
  • Видалені URL-адреси або ті, що повертають помилку 404, видаляються з sitemap.
  • Сторінки з тегом noindex не повинні потрапляти до sitemap.
  • Сторінки з канонічною адресою, відмінною від їхньої власної, потребують обережного керування.
  • Поле lastmod оновлюється лише за реальної зміни контенту.

Ця автоматизація критично важлива для технічного здоров'я SEO, особливо в проєктах, які часто оновлюються: новинних, дошках оголошень, бронювання, освітніх та e-commerce платформах.

Як вказати sitemap у файлі robots.txt?

Додавання адреси sitemap в кінець файлу robots.txt є гарною практикою. Це дозволяє ботам легко знайти вашу карту сайту. Приклад використання:

  • User-agent: *
  • Allow: /
  • Sitemap: https://vashdomen.com/sitemap.xml

Якщо у вас кілька файлів sitemap, ви можете вказати кожен з них в окремому рядку:

  • Sitemap: https://vashdomen.com/post-sitemap.xml
  • Sitemap: https://vashdomen.com/product-sitemap.xml
  • Sitemap: https://vashdomen.com/category-sitemap.xml

Якщо ваш домен використовує HTTPS, то URL-адреси sitemap також повинні бути HTTPS. Варіації HTTP, www і non-www не повинні змішуватися. Тому важливо правильно налаштувати доменне ім'я, SSL і переадресацію з самого початку. Якщо ви запускаєте новий проєкт, розгляньте кроки перевірка домену та SSL сертифікат разом із вашим планом технічного SEO.

Як надіслати sitemap до Google Search Console

Як надіслати sitemap до Google Search Console

Після створення sitemap його необхідно надіслати через Google Search Console. Кроки наступні:

  • Увійдіть до Google Search Console.
  • Виберіть правильний ресурс. Бажано використовувати ресурс на рівні домену.
  • Перейдіть до розділу «Карти сайту» в лівому меню.
  • Введіть URL-адресу sitemap. Наприклад, sitemap.xml.
  • Натисніть кнопку «Надіслати».
  • У розділі статусу перевірте інформацію про успішність і кількість виявлених URL-адрес.

Не очікуйте, що всі сторінки будуть проіндексовані одразу після надсилання sitemap. Спочатку Google виявляє URL-адреси, потім сканує, обробляє їх і на основі сигналів якості вирішує, чи індексувати їх. Для нових сайтів цей процес може тривати від кількох днів до кількох тижнів. Сильна внутрішня перелінковка, якісний контент і швидка відповідь сервера позитивно впливають на цей процес.

Найпоширеніші помилки в robots.txt і sitemap

1. Випадкове блокування всього сайту

Найкритичніша помилка — залишити правило Disallow: / на живому сайті. Це правило забороняє сканування всього сайту. Якщо це налаштування, використане в середовищі розробки, не прибрати під час перенесення на продакшн, Google не зможе сканувати нові сторінки. Контрольний список для запуску живого сайту обов'язково має включати перевірку robots.txt.

2. Додавання noindex-сторінок до sitemap

Якщо встановити для сторінки тег noindex і водночас додати її до sitemap, це створить суперечливий сигнал. Sitemap каже: «Ця сторінка важлива», а noindex: «Не індексуй цю сторінку». Тому sitemap має складатися лише з URL-адрес, які ви хочете бачити в індексі.

3. Зберігання в карті сайту URL-адрес із кодами 301, 404 або 500

URL-адреси в sitemap в ідеалі повинні повертати код статусу 200. URL-адреси, які перенаправляють, не знайдені або викликають помилку сервера, слід регулярно вичищати. Щомісячне технічне SEO-сканування допоможе вам виявити ці помилки на ранній стадії.

4. Використання неправильного доменного імені або протоколу

Якщо ви використовуєте https://www.vashdomen.com, то URL-адреси всередині sitemap також повинні бути в цьому ж форматі. Різні варіації протоколу або доменного імені можуть ускладнити для Google об'єднання сигналів. Тому канонічні адреси, sitemap, robots.txt і структура переадресації повинні вказувати на один і той самий основний формат URL-адреси.

5. Надсилання занадто великої кількості URL-адрес

Sitemap — це не сміттєвий кошик. Замість того щоб додавати кожну URL-адресу, включіть лише ті якісні сторінки, які ви дійсно хочете проіндексувати. Залишаючи неякісні, дубльовані або слабкі сторінки поза sitemap, ви надсилаєте пошуковим системам чистіший сигнал.

Чек-лист технічного SEO на 2026 рік

Під час підготовки файлів robots.txt і sitemap ви можете скористатися наведеним нижче контрольним списком:

  • Чи знаходиться robots.txt у кореневому каталозі та чи доступний він?
  • Чи правильно вказано адресу sitemap у файлі robots.txt?
  • Чи не заблоковані важливі сторінки у файлі robots.txt?
  • Чи доступні для сканування ресурси CSS, JavaScript і зображення?
  • Чи містить sitemap лише індексабельні URL-адреси, які повертають код 200?
  • Чи виключені noindex-сторінки з sitemap?
  • Чи відображають дати lastmod реальні оновлення?
  • Чи використовується індекс sitemap для великих сайтів?
  • Чи успішно оброблено sitemap у Google Search Console?
  • Чи сприяє час відповіді сервера ефективності сканування?

Технічне SEO не обмежується лише створенням файлів. Продуктивність хостингу, конфігурація SSL, коректність DNS, переадресації, мобільна адаптивність і якість контенту також мають прямий вплив. Тому, плануючи інфраструктуру вашого проєкту, корисно розглядати в комплексі питання хостинг пакети, трансфер домену та безпека вебсайту.

Приклад стратегії robots.txt і sitemap

Для простого корпоративного вебсайту рекомендована структура може бути такою: головна сторінка, сторінки послуг, «Про нас», контакти та публікації блогу включаються до sitemap. Адмінпанель, сторінки подяки після заповнення форм, тимчасові тести акцій і результати внутрішнього пошуку керуються через robots.txt або noindex. На такому сайті sitemap зазвичай містить від 20 до 200 URL-адрес.

Для інтернет-магазину середнього розміру sitemap'и товарів, категорій, брендів і блогу можна тримати окремо. Активні товари додаються до sitemap, остаточно видалені — прибираються, для схожих товарів налаштовується 301 редирект. URL-адреси фільтрів аналізуються індивідуально. Фільтри з пошуковим попитом і потенціалом конверсії оформлюються як окремі категорії; інші контролюються за допомогою стратегії robots.txt, canonical або noindex.

Для насиченого контентом блогу або новинного сайту критично важливі дати публікацій, дати оновлень, структура категорій і внутрішня перелінковка. Коли старі матеріали оновлюються, поле lastmod має коректно змінюватися, але не слід робити штучних оновлень. Сигнал, якому довіряє Google, — це реальне покращення контенту.

Часті запитання

Чи повністю robots.txt блокує індексацію?

Ні. Robots.txt блокує сканування, але не завжди повністю запобігає індексації. Якщо URL-адреса отримує посилання з інших сайтів, Google може показати її в індексі, навіть не скануючи. Для запобігання індексації зазвичай слід використовувати тег noindex або відповідне обмеження доступу.

Чи допомагає файл sitemap піднятися на вищі позиції в Google?

Sitemap не дає прямих гарантій високих позицій. Однак він допомагає швидше виявляти важливі сторінки, повідомляти пошукові системи про оновлення та покращувати загальний стан технічного SEO. Для ранжування також потрібні якість контенту, посилання, користувацький досвід, швидкість і сигнали довіри.

Чи обов'язково вказувати sitemap у файлі robots.txt?

Це не обов'язково, але рекомендовано. Додавання адреси sitemap до robots.txt дозволяє пошуковим системам легше знаходити вашу карту сайту. Крім того, гарною практикою є надсилання sitemap через Google Search Console.

Яка адреса sitemap у WordPress?

Стандартна адреса sitemap WordPress зазвичай має вигляд /wp-sitemap.xml. Якщо ви використовуєте SEO-плагіни, адреса може бути /sitemap_index.xml або /sitemap.xml. Вам потрібно перевірити адресу залежно від того, який плагін ви використовуєте.

Скільки URL-адрес може містити sitemap?

Один файл XML sitemap повинен містити не більше 50 000 URL-адрес і не перевищувати ліміт у 50 МБ. Для більших сайтів найкращим підходом є використання індексу sitemap і розподіл контенту за окремими файлами: сторінки, записи, товари, категорії або зображення.

Висновок

Robots.txt і sitemap — це дві, на перший погляд, невеликі, але надзвичайно впливові складові технічного SEO. Robots.txt керує поведінкою ботів під час сканування, тоді як sitemap полегшує виявлення важливих URL-адрес. Для правильної конфігурації вам слід залишати важливі сторінки відкритими, контрольовано обмежувати непотрібні розділи, додавати до sitemap лише індексабельні URL-адреси та регулярно відстежувати все через Google Search Console.

Якщо ви хочете закласти міцний технічний фундамент для свого вебсайту, варто почати з надійного хостингу, правильного керування доменним ім'ям і налаштування SSL. Ознайомтеся з рішеннями Hostragons веб хостинг, домен та SSL сертифікат, щоб створити для свого сайту швидку, безпечну та SEO-дружню інфраструктуру.

Поділитися цією статтею:
Alihan Yıldırım

Експерт з веб-продуктивності

Має понад 10 років досвіду в аналізі продуктивності веб-сайтів та оптимізації швидкості. Працює з CDN та системами кешування.

Усі статті →