دا څه دي، دا څنګه ترسره کیږي

robots.txt و نقشه سایت (sitemap) چیست و چگونه بسازیم؟

  • 12 د لوستلو لپاره دقیقې
robots.txt و نقشه سایت (sitemap) چیست و چگونه بسازیم؟

فایل robots.txt و نقشه سایت دو ابزار پایه‌ای در سئوی فنی هستند که نحوه خزش ربات‌های موتور جستجو و کشف صفحات مهم وب‌سایت را کنترل می‌کنند. robots.txt به گوگل‌بات و ربات‌های مشابه می‌گوید کدام بخش‌ها را بخوانند و از کدام بخش‌ها دوری کنند؛ sitemap یا همان نقشه سایت هم فهرست آدرس‌های مهم، تاریخ به‌روزرسانی و ساختار صفحات را به موتورهای جستجو اعلام می‌کند. به زبان ساده: robots.txt مسیر خزش را مشخص می‌کند و sitemap سرعت کشف صفحات را بالا می‌برد. داشتن نسخه درست و به‌روز این دو فایل به‌خصوص برای سایت‌های تازه‌تأسیس، فروشگاه‌های آنلاین، وب‌سایت‌های شرکتی و آرشیوهای بزرگ محتوایی، بازدهی ایندکس شدن را به شکل چشمگیری افزایش می‌دهد.

در این راهنما قدم‌به‌قدم توضیح می‌دهیم که robots.txt و sitemap را چطور آماده کنید، چه دستورهایی به کار ببرید، در وردپرس و سایت‌های اختصاصی به چه نکاتی توجه کنید، خطاها را چطور تست کنید و در نهایت فایل‌ها را به گوگل بفرستید. این محتوا با تمرکز بر استانداردهای سئوی ۲۰۲۶، نیت کاربر، بودجه خزش، قابلیت ایندکس شدن و کاربرد عملی نوشته شده است.

robots.txt چیست؟

فایل robots.txt یک فایل متنی ساده است که در ریشه اصلی هاست وب‌سایت قرار می‌گیرد و معمولاً از آدرس https://yourdomain.com/robots.txt در دسترس است. این فایل به ربات‌های جستجو دستور می‌دهد کدام پوشه‌ها یا صفحات را بخزند و از خزش کدام‌ها صرف‌نظر کنند. نکته مهم اینجاست که robots.txt ابزار امنیتی نیست؛ فقط یک راهنما برای ربات‌های خوش‌نیت به شمار می‌رود.

برای مثال می‌توانید پنل مدیریت، مراحل سبد خرید، پارامترهای فیلتر، صفحات نتایج جستجوی داخلی یا پوشه‌های آزمایشی را از خزش موتور جستجو خارج کنید. اما اطلاعات محرمانه را نمی‌توان با robots.txt محافظت کرد چون هر کسی می‌تواند آن را ببیند. برای امنیت واقعی باید از رمز عبور، محدودیت دسترسی سمت سرور، هاستینگ امن و گواهی SSL استفاده کنید. در همین راستا برای امنیت پایه وب‌سایت‌تان می‌توانید SSL Certificate و برای زیرساخت پرسرعت د ویب کوربه توب را بررسی کنید.

فایل robots.txt چه کاربردی دارد؟

  • رفتار خزش ربات‌های موتور جستجو را هدایت می‌کند.
  • خزش صفحات کم‌اهمیت یا تکراری را کاهش می‌دهد.
  • بودجه خزش را به صفحات مهم اختصاص می‌دهد.
  • موقعیت فایل نقشه سایت را به ربات‌ها اعلام می‌کند.
  • از خزش پنل مدیریت، جستجوی داخلی، صفحات آزمایشی و آدرس‌های پارامتری جلوگیری می‌کند.

به‌خصوص در سایت‌هایی که هزاران محصول، دسته‌بندی، برچسب یا صفحه فیلتر دارند، اگر robots.txt درست تنظیم نشود، گوگل صفحات کلیدی را دیرتر پیدا می‌کند. از طرف دیگر اگر خیلی محدودکننده باشد، فایل‌های CSS، جاوااسکریپت، تصاویر یا صفحات دسته‌بندی هم ممکن است بسته شوند و رتبه‌بندی آسیب ببیند.

نقشه سایت (sitemap) چیست؟

نقشه سایت یا sitemap فایلی با فرمت XML است که فهرست آدرس‌های مهم وب‌سایت را به موتورهای جستجو معرفی می‌کند. معمولاً در آدرس https://yourdomain.com/sitemap.xml قرار دارد. این فایل به گوگل و بینگ می‌گوید: «این صفحات برای من مهم هستند، لطفاً آن‌ها را کشف و در صورت مناسب بودن ایندکس کنید.»

در یک فایل sitemap اطلاعاتی مثل آدرس صفحه، تاریخ آخرین به‌روزرسانی، میزان تغییر و اولویت وجود دارد. در رویکرد سئوی ۲۰۲۶، تاریخ آخرین به‌روزرسانی اهمیت بیشتری پیدا کرده چون موتورهای جستجو به دنبال محتوای تازه و باکیفیت هستند. با این حال، وجود یک آدرس در sitemap تضمینی برای ایندکس شدن آن نیست. صفحه باید باکیفیت، در دسترس، قابل ایندکس، دارای تگ کانونیکال درست و مطابق نیت کاربر باشد.

چه زمانی به فایل sitemap نیاز داریم؟

  • وقتی وب‌سایت تازه راه‌اندازی شده باشد.
  • تعداد صفحات، محصولات یا مطالب وبلاگ زیاد باشد.
  • لینک‌دهی داخلی ضعیف باشد.
  • محتوای تصویری، ویدیویی یا خبری زیاد داشته باشیم.
  • در فروشگاه آنلاین محصولات مرتب به‌روزرسانی شوند.
  • محتوای قدیمی را به‌صورت منظم به‌روزرسانی کنیم.

حتی در وب‌سایت‌های کوچک با ساختار لینک داخلی مناسب، استفاده از sitemap کار درستی است چون فهرست روشنی از آدرس‌ها به موتور جستجو می‌دهد و تأخیر در کشف صفحات را کم می‌کند.

تفاوت robots.txt و sitemap

این دو فایل با هم کار می‌کنند اما وظایف متفاوتی دارند. robots.txt بیشتر روی اجازه یا منع خزش تمرکز دارد، در حالی که sitemap آدرس‌هایی را که می‌خواهید کشف شوند فهرست می‌کند. جدول زیر تفاوت‌های اصلی را نشان می‌دهد.

تفاوت robots.txt و sitemap
ویژگیروبوټونه.txtsitemap
هدف اصلیهدایت ربات‌ها برای خزش بخش‌های مجازمعرفی آدرس‌های مهم به موتور جستجو
محل فایلریشه سایت: /robots.txtمعمولاً /sitemap.xml
فرمتمتن سادهXML
تضمین ایندکسخیرخیر
ریسک استفاده نادرستممکن است صفحات مهم را ببنددممکن است صفحات بی‌کیفیت یا noindex را بفرستد
تأثیر سئوکمک به مدیریت بودجه خزشتقویت کشف آدرس و سیگنال به‌روزرسانی

چگونه فایل robots.txt بسازیم؟

ساخت فایل robots.txt از نظر فنی ساده است، اما از نظر سئو نیاز به دقت دارد. نام فایل باید دقیقاً robots.txt باشد و در ریشه هاست قرار بگیرد. یعنی آدرس درست https://yourdomain.com/robots.txt است. قرار دادن فایل در زیرپوشه‌ها اعتباری ندارد.

۱. ساختار پایه robots.txt را بسازید

ساده‌ترین ساختار، اجازه خزش کامل به همه ربات‌ها و اعلام موقعیت sitemap است:

  • User-agent: *
  • Allow: /
  • Sitemap: https://yourdomain.com/sitemap.xml

در اینجا User-agent: * یعنی همه ربات‌ها و Allow: / یعنی اجازه خزش کل سایت. خط Sitemap هم موقعیت نقشه سایت را اعلام می‌کند. برای سایت‌های جدید که می‌خواهید سریع ایندکس شوند، این ساختار معمولاً نقطه شروع خوبی است.

۲. بخش‌هایی که نمی‌خواهید خزش شوند را مشخص کنید

لازم نیست همه صفحات خزش شوند. صفحات شخصی کاربر، صفحات موقتی، صفحات تکراری یا صفحات کم‌ارزش سئو را می‌توان با robots.txt محدود کرد. مثال:

  • Disallow: /wp-admin/
  • Disallow: /cart/
  • Disallow: /checkout/
  • Disallow: /search/
  • Disallow: /test/

در وردپرس بستن پوشه /wp-admin/ رایج است، اما برای کارکرد درست برخی فایل‌های AJAX باید اجازه دسترسی به /wp-admin/admin-ajax.php را بدهید. بنابراین ساختار مناسب وردپرس به این شکل می‌شود:

  • User-agent: *
  • Disallow: /wp-admin/
  • Allow: /wp-admin/admin-ajax.php
  • Sitemap: https://yourdomain.com/sitemap.xml

در این مثال پنل مدیریت بسته می‌شود اما AJAX مورد نیاز قالب و افزونه‌ها باز می‌ماند. برای اجرای سریع‌تر و پایدارتر وردپرس می‌توانید WordPress Hosting را هم بررسی کنید.

۳. کنترل پارامترها و فیلترها در فروشگاه‌های آنلاین

در فروشگاه‌های آنلاین، فیلتر رنگ، سایز، قیمت، موجودی و مرتب‌سازی آدرس‌های زیادی تولید می‌کنند. مثلاً /kafsh?color=black، /kafsh?size=42. اگر این موضوع کنترل نشود، ربات گوگل هزاران صفحه کم‌ارزش پارامتری را می‌خزد.

برای این بخش‌ها بهتر است robots.txt را همراه با تگ کانونیکال و داده‌های گوگل سرچ کنسول بررسی کنید. بستن همه پارامترها با robots.txt همیشه راه‌حل درست نیست چون برخی صفحات فیلتر ممکن است نیت تجاری داشته باشند و ارزش ایندکس شدن داشته باشند.

۴. فایل‌های CSS و JavaScript را نبندید

در سئوی مدرن گوگل صفحات را نه فقط به صورت HTML خام، بلکه به صورت رندرشده بررسی می‌کند. بستن CSS و JavaScript باعث می‌شود گوگل ساختار صفحه، سازگاری موبایل و نحوه بارگذاری محتوا را به‌درستی درک نکند. دستورهایی مثل Disallow: /assets/ یا Disallow: /js/ امروز ریسکی محسوب می‌شوند.

رویکرد ایمن در سال ۲۰۲۶ این است: فایل‌های CSS، JS، تصاویر و فونت که تجربه کاربری را می‌سازند باید برای ربات‌ها باز باشند. فقط پوشه‌های مدیریتی، آزمایشی یا خصوصی را محدود کنید.

۵. فایل robots.txt را تست کنید

بعد از آپلود فایل حتماً آن را بررسی کنید. موارد مهم:

  • آدرس https://yourdomain.com/robots.txt با کد ۲۰۰ باز می‌شود؟
  • فایل خالی، اشتباه یا متعلق به دامنه دیگری نیست؟
  • خط Sitemap آدرس درست را نشان می‌دهد؟
  • صفحات مهم دسته‌بندی، محصول و وبلاگ بسته نشده‌اند؟
  • CSS، JS و تصاویر به اشتباه محدود نشده‌اند؟

با ابزار URL Inspection در گوگل سرچ کنسول می‌توانید قابلیت خزش صفحات مهم را چک کنید. تحلیل لاگ سرور هم روش پیشرفته‌تری برای دیدن رفتار گوگل‌بات است. برای عملکرد قوی سرور می‌توانید VPS Server یا Corporate Hosting را در نظر بگیرید.

چگونه فایل sitemap بسازیم؟

هدف از ساخت sitemap این است که فهرست تمیز و باکیفیتی از آدرس‌های مهم و قابل ایندکس به موتور جستجو بدهید. لازم نیست همه صفحات در sitemap باشند. حتی اضافه کردن صفحات noindex، ریدایرکت‌شده یا خطادار می‌تواند سیگنال منفی بفرستد.

۱. فقط آدرس‌های قابل ایندکس را اضافه کنید

صفحاتی که در sitemap قرار می‌گیرند باید این شرایط را داشته باشند:

  • کد وضعیت ۲۰۰ برگردانند.
  • تگ noindex نداشته باشند.
  • با robots.txt محدود نشده باشند.
  • تگ کانونیکال به خودشان یا آدرس درست اشاره کند.
  • محتوای منحصربه‌فرد و ارزشمند داشته باشند.
  • موبایل‌فرندلی و سریع باشند.

بنابراین صفحات محصول حذف‌شده، محصولات ناموجود که دائماً حذف شده‌اند، نتایج جستجوی داخلی، سبد خرید و صفحات پرداخت نباید در sitemap باشند. در عوض صفحات دسته‌بندی اصلی، زیرمجموعه‌های مهم، خدمات، مقالات وبلاگ و محصولات فعال باید اضافه شوند.

۲. فرمت XML را درست به کار ببرید

ساختار ساده XML sitemap به این شکل است:

  • <urlset> تگ اصلی است.
  • <url> برای هر صفحه یک بلاک جداگانه.
  • <loc> آدرس کامل صفحه را نگه می‌دارد.
  • <lastmod> تاریخ آخرین به‌روزرسانی را نشان می‌دهد.

مثال: <loc>https://yourdomain.com/services/</loc> و <lastmod>2026-01-15</lastmod>. فرمت تاریخ بهتر است سال-ماه-روز باشد. به‌روزرسانی خودکار و واقعی lastmod مهم است؛ به‌روز کردن مصنوعی تاریخ همه آدرس‌ها هر روز کار درستی نیست.

۳. در سایت‌های بزرگ sitemap را تقسیم کنید

هر فایل XML sitemap حداکثر ۵۰٬۰۰۰ آدرس و ۵۰ مگابایت حجم uncompressed داشته باشد. در سایت‌های بزرگ بهتر است از sitemap index استفاده کنید. مثلاً:

  • /post-sitemap.xml
  • /page-sitemap.xml
  • /product-sitemap.xml
  • /category-sitemap.xml
  • /image-sitemap.xml

این روش هم پردازش را برای موتور جستجو آسان‌تر می‌کند و هم تحلیل مشکلات ایندکس هر نوع محتوا را ساده‌تر می‌سازد.

۴. ساخت sitemap در وردپرس

وردپرس از نسخه ۵.۵ به بعد نقشه سایت XML داخلی دارد که معمولاً در /wp-sitemap.xml در دسترس است. اما در پروژه‌های حرفه‌ای افزونه‌هایی مثل Rank Math یا Yoast SEO کنترل دقیق‌تری ارائه می‌دهند. با این افزونه‌ها می‌توانید تصمیم بگیرید کدام نوع محتوا در sitemap باشد و آیا آرشیو برچسب‌ها نمایش داده شوند یا نه.

اشتباه رایج در وردپرس اضافه کردن صفحات برچسب کم‌ارزش به sitemap است. اگر این صفحات توضیح منحصربه‌فرد و تقاضای جستجوی واقعی ندارند، بهتر است خارج از sitemap نگه داشته شوند.

۵. اتوماسیون sitemap در سایت‌های اختصاصی

در سایت‌های اختصاصی بهتر است sitemap به‌صورت خودکار تولید شود. هر بار که محصول جدیدی اضافه یا مقاله‌ای منتشر می‌شود، sitemap هم به‌روز شود. توسعه‌دهندگان باید این قوانین را رعایت کنند:

  • صفحات منتشرشده خودکار اضافه شوند.
  • صفحات حذف‌شده یا ۴۰۴ از sitemap حذف شوند.
  • صفحات noindex وارد sitemap نشوند.
  • آدرس‌های کانونیکال متفاوت با دقت مدیریت شوند.
  • lastmod فقط هنگام تغییر واقعی محتوا به‌روز شود.

این اتوماسیون به‌خصوص برای سایت‌های خبری، آگهی، رزرو و فروشگاه آنلاین حیاتی است.

چگونه آدرس sitemap را در robots.txt اعلام کنیم؟

بهترین کار این است که آدرس sitemap را در انتهای robots.txt اضافه کنید تا ربات‌ها سریع‌تر آن را پیدا کنند:

  • User-agent: *
  • Allow: /
  • Sitemap: https://yourdomain.com/sitemap.xml

اگر چند فایل sitemap دارید، هر کدام را در خط جداگانه بنویسید:

  • Sitemap: https://yourdomain.com/post-sitemap.xml
  • Sitemap: https://yourdomain.com/product-sitemap.xml

اگر سایت‌تان HTTPS است، آدرس‌های داخل sitemap هم باید HTTPS باشند و از ترکیب www و non-www اجتناب کنید.

ارسال sitemap به گوگل سرچ کنسول

ارسال sitemap به گوگل سرچ کنسول

بعد از ساخت sitemap باید آن را از طریق گوگل سرچ کنسول ارسال کنید:

  • به گوگل سرچ کنسول وارد شوید.
  • مورد نظر را انتخاب کنید (ترجیحاً property نوع دامنه).
  • از منوی سمت چپ بخش Sitemaps را باز کنید.
  • آدرس sitemap را وارد کنید (مثلاً sitemap.xml).
  • دکمه Submit را بزنید.
  • وضعیت را چک کنید و تعداد آدرس‌های کشف‌شده را ببینید.

ارسال sitemap به معنای ایندکس فوری همه صفحات نیست. گوگل ابتدا آدرس‌ها را کشف، خزش و پردازش می‌کند و سپس بر اساس سیگنال‌های کیفی تصمیم به ایندکس می‌گیرد.

اشتباهات رایج در robots.txt و sitemap

۱. بستن کل سایت به اشتباه

بزرگ‌ترین اشتباه گذاشتن دستور Disallow: / روی سایت زنده است. این دستور همه چیز را می‌بندد. اگر این تنظیم از محیط توسعه به سایت اصلی منتقل شود، گوگل هیچ صفحه جدیدی را نخواهد خزید.

۲. اضافه کردن صفحات noindex به sitemap

دادن تگ noindex و همزمان قرار دادن صفحه در sitemap سیگنال متناقض ایجاد می‌کند. sitemap می‌گوید «این صفحه مهم است» و noindex می‌گوید «ایندکس نکن». بنابراین فقط صفحاتی را در sitemap بگذارید که واقعاً می‌خواهید ایندکس شوند.

۳. نگه داشتن آدرس‌های ۳۰۱، ۴۰۴ یا ۵۰۰ در sitemap

آدرس‌های داخل sitemap باید کد ۲۰۰ برگردانند. آدرس‌های ریدایرکت‌شده، حذف‌شده یا خطادار را به‌صورت ماهانه پاک کنید.

۴. استفاده از پروتکل یا دامنه اشتباه

اگر سایت‌تان روی https://www.yourdomain.com است، همه آدرس‌های sitemap هم باید دقیقاً همین فرمت را داشته باشند.

۵. ارسال تعداد زیاد آدرس بی‌کیفیت

sitemap سطل زباله نیست. فقط صفحات باکیفیت و ارزشمند را اضافه کنید تا سیگنال تمیزتری به موتور جستجو بفرستید.

چک‌لیست سئوی فنی برای سال ۲۰۲۶

هنگام آماده‌سازی robots.txt و sitemap این موارد را بررسی کنید:

  • فایل robots.txt در ریشه سایت در دسترس است؟
  • آدرس sitemap داخل robots.txt درست اعلام شده؟
  • صفحات مهم با robots.txt بسته نشده‌اند؟
  • فایل‌های CSS، JavaScript و تصاویر قابل خزش هستند؟
  • sitemap فقط شامل آدرس‌های ۲۰۰ و قابل ایندکس است؟
  • صفحات noindex خارج از sitemap نگه داشته شده‌اند؟
  • تاریخ lastmod واقعی است؟
  • در سایت‌های بزرگ از sitemap index استفاده شده؟
  • گوگل سرچ کنسول sitemap را با موفقیت پردازش کرده؟

سئوی فنی فقط ساخت فایل نیست. عملکرد هاست، تنظیم SSL، DNS، ریدایرکت‌ها و سرعت سرور هم تأثیر مستقیم دارند. بنابراین هنگام برنامه‌ریزی زیرساخت، Hosting Packages، د ډومین لیږد و Website Security را با هم در نظر بگیرید.

مثال استراتژی robots.txt و sitemap

برای یک وب‌سایت شرکتی ساده، صفحات اصلی، خدمات، درباره ما، تماس و مقالات وبلاگ در sitemap قرار می‌گیرند و پنل مدیریت، صفحات تشکر فرم و تست‌های موقتی با robots.txt یا noindex کنترل می‌شوند. در فروشگاه آنلاین متوسط بهتر است sitemap محصولات، دسته‌بندی‌ها و مقالات را جدا کنید و محصولات حذف‌شده را خارج کنید. در سایت‌های خبری هم تاریخ انتشار واقعی و به‌روزرسانی‌های معنادار مهم‌ترین سیگنال برای گوگل هستند.

سؤالات متداول

آیا robots.txt ایندکس شدن را کاملاً متوقف می‌کند؟

خیر. robots.txt فقط خزش را محدود می‌کند. اگر صفحه از سایت‌های دیگر لینک بگیرد، گوگل ممکن است بدون خزش هم آن را ایندکس کند. برای جلوگیری قطعی از ایندکس معمولاً از تگ noindex استفاده می‌شود.

آیا sitemap باعث رتبه بهتر در گوگل می‌شود؟

sitemap به‌تنهایی رتبه تضمینی نمی‌دهد، اما کشف سریع‌تر صفحات و ارسال سیگنال به‌روزرسانی را آسان‌تر می‌کند. رتبه‌بندی نهایی به کیفیت محتوا، بک‌لینک، تجربه کاربری و سرعت بستگی دارد.

آیا اعلام sitemap در robots.txt الزامی است؟

الزامی نیست ولی توصیه می‌شود. همچنین ارسال مستقیم sitemap از گوگل سرچ کنسول هم کار خوبی است.

آدرس پیش‌فرض sitemap در وردپرس چیست؟

معمولاً /wp-sitemap.xml. اگر از افزونه سئو استفاده می‌کنید ممکن است آدرس /sitemap_index.xml یا /sitemap.xml باشد.

حداکثر تعداد آدرس در یک sitemap چقدر است؟

هر فایل XML حداکثر ۵۰٬۰۰۰ آدرس و ۵۰ مگابایت حجم uncompressed. برای سایت‌های بزرگ از sitemap index استفاده کنید.

نتیجه‌گیری

robots.txt و sitemap دو بخش کوچک اما بسیار مؤثر از سئوی فنی هستند. robots.txt رفتار خزش ربات‌ها را هدایت می‌کند و sitemap کشف آدرس‌های مهم را سرعت می‌بخشد. با تنظیم درست، صفحات کلیدی را باز بگذارید، بخش‌های غیرضروری را هوشمندانه ببندید، فقط آدرس‌های قابل ایندکس را در sitemap قرار دهید و به‌صورت منظم در گوگل سرچ کنسول پیگیری کنید.

برای داشتن پایه فنی محکم، از هاستینگ مطمئن، مدیریت درست دامنه و SSL استفاده کنید. راه‌حل‌های د ویب کوربه توب، ډومین و SSL Certificate هاست راگونس را بررسی کنید تا زیرساختی سریع، امن و سازگار با سئو داشته باشید.

دا مقاله شریکه کړئ:
Alihan Yıldırım

د ویب فعالیت متخصص

په ویب فعالیت تحلیل او سرعت اصلاح کې د ۱۰+ کلونو تجربه لري. په CDN او د کیش سیسټمونو باندې کار کوي.

ټولې لیکنې →