فایل robots.txt و نقشه سایت دو ابزار پایهای در سئوی فنی هستند که نحوه خزش رباتهای موتور جستجو و کشف صفحات مهم وبسایت را کنترل میکنند. robots.txt به گوگلبات و رباتهای مشابه میگوید کدام بخشها را بخوانند و از کدام بخشها دوری کنند؛ sitemap یا همان نقشه سایت هم فهرست آدرسهای مهم، تاریخ بهروزرسانی و ساختار صفحات را به موتورهای جستجو اعلام میکند. به زبان ساده: robots.txt مسیر خزش را مشخص میکند و sitemap سرعت کشف صفحات را بالا میبرد. داشتن نسخه درست و بهروز این دو فایل بهخصوص برای سایتهای تازهتأسیس، فروشگاههای آنلاین، وبسایتهای شرکتی و آرشیوهای بزرگ محتوایی، بازدهی ایندکس شدن را به شکل چشمگیری افزایش میدهد.
در این راهنما قدمبهقدم توضیح میدهیم که robots.txt و sitemap را چطور آماده کنید، چه دستورهایی به کار ببرید، در وردپرس و سایتهای اختصاصی به چه نکاتی توجه کنید، خطاها را چطور تست کنید و در نهایت فایلها را به گوگل بفرستید. این محتوا با تمرکز بر استانداردهای سئوی ۲۰۲۶، نیت کاربر، بودجه خزش، قابلیت ایندکس شدن و کاربرد عملی نوشته شده است.
robots.txt چیست؟
فایل robots.txt یک فایل متنی ساده است که در ریشه اصلی هاست وبسایت قرار میگیرد و معمولاً از آدرس https://yourdomain.com/robots.txt در دسترس است. این فایل به رباتهای جستجو دستور میدهد کدام پوشهها یا صفحات را بخزند و از خزش کدامها صرفنظر کنند. نکته مهم اینجاست که robots.txt ابزار امنیتی نیست؛ فقط یک راهنما برای رباتهای خوشنیت به شمار میرود.
برای مثال میتوانید پنل مدیریت، مراحل سبد خرید، پارامترهای فیلتر، صفحات نتایج جستجوی داخلی یا پوشههای آزمایشی را از خزش موتور جستجو خارج کنید. اما اطلاعات محرمانه را نمیتوان با robots.txt محافظت کرد چون هر کسی میتواند آن را ببیند. برای امنیت واقعی باید از رمز عبور، محدودیت دسترسی سمت سرور، هاستینگ امن و گواهی SSL استفاده کنید. در همین راستا برای امنیت پایه وبسایتتان میتوانید SSL Certificate و برای زیرساخت پرسرعت د ویب کوربه توب را بررسی کنید.
فایل robots.txt چه کاربردی دارد؟
- رفتار خزش رباتهای موتور جستجو را هدایت میکند.
- خزش صفحات کماهمیت یا تکراری را کاهش میدهد.
- بودجه خزش را به صفحات مهم اختصاص میدهد.
- موقعیت فایل نقشه سایت را به رباتها اعلام میکند.
- از خزش پنل مدیریت، جستجوی داخلی، صفحات آزمایشی و آدرسهای پارامتری جلوگیری میکند.
بهخصوص در سایتهایی که هزاران محصول، دستهبندی، برچسب یا صفحه فیلتر دارند، اگر robots.txt درست تنظیم نشود، گوگل صفحات کلیدی را دیرتر پیدا میکند. از طرف دیگر اگر خیلی محدودکننده باشد، فایلهای CSS، جاوااسکریپت، تصاویر یا صفحات دستهبندی هم ممکن است بسته شوند و رتبهبندی آسیب ببیند.
نقشه سایت (sitemap) چیست؟
نقشه سایت یا sitemap فایلی با فرمت XML است که فهرست آدرسهای مهم وبسایت را به موتورهای جستجو معرفی میکند. معمولاً در آدرس https://yourdomain.com/sitemap.xml قرار دارد. این فایل به گوگل و بینگ میگوید: «این صفحات برای من مهم هستند، لطفاً آنها را کشف و در صورت مناسب بودن ایندکس کنید.»
در یک فایل sitemap اطلاعاتی مثل آدرس صفحه، تاریخ آخرین بهروزرسانی، میزان تغییر و اولویت وجود دارد. در رویکرد سئوی ۲۰۲۶، تاریخ آخرین بهروزرسانی اهمیت بیشتری پیدا کرده چون موتورهای جستجو به دنبال محتوای تازه و باکیفیت هستند. با این حال، وجود یک آدرس در sitemap تضمینی برای ایندکس شدن آن نیست. صفحه باید باکیفیت، در دسترس، قابل ایندکس، دارای تگ کانونیکال درست و مطابق نیت کاربر باشد.
چه زمانی به فایل sitemap نیاز داریم؟
- وقتی وبسایت تازه راهاندازی شده باشد.
- تعداد صفحات، محصولات یا مطالب وبلاگ زیاد باشد.
- لینکدهی داخلی ضعیف باشد.
- محتوای تصویری، ویدیویی یا خبری زیاد داشته باشیم.
- در فروشگاه آنلاین محصولات مرتب بهروزرسانی شوند.
- محتوای قدیمی را بهصورت منظم بهروزرسانی کنیم.
حتی در وبسایتهای کوچک با ساختار لینک داخلی مناسب، استفاده از sitemap کار درستی است چون فهرست روشنی از آدرسها به موتور جستجو میدهد و تأخیر در کشف صفحات را کم میکند.
تفاوت robots.txt و sitemap
این دو فایل با هم کار میکنند اما وظایف متفاوتی دارند. robots.txt بیشتر روی اجازه یا منع خزش تمرکز دارد، در حالی که sitemap آدرسهایی را که میخواهید کشف شوند فهرست میکند. جدول زیر تفاوتهای اصلی را نشان میدهد.
| ویژگی | روبوټونه.txt | sitemap |
|---|---|---|
| هدف اصلی | هدایت رباتها برای خزش بخشهای مجاز | معرفی آدرسهای مهم به موتور جستجو |
| محل فایل | ریشه سایت: /robots.txt | معمولاً /sitemap.xml |
| فرمت | متن ساده | XML |
| تضمین ایندکس | خیر | خیر |
| ریسک استفاده نادرست | ممکن است صفحات مهم را ببندد | ممکن است صفحات بیکیفیت یا noindex را بفرستد |
| تأثیر سئو | کمک به مدیریت بودجه خزش | تقویت کشف آدرس و سیگنال بهروزرسانی |
چگونه فایل robots.txt بسازیم؟
ساخت فایل robots.txt از نظر فنی ساده است، اما از نظر سئو نیاز به دقت دارد. نام فایل باید دقیقاً robots.txt باشد و در ریشه هاست قرار بگیرد. یعنی آدرس درست https://yourdomain.com/robots.txt است. قرار دادن فایل در زیرپوشهها اعتباری ندارد.
۱. ساختار پایه robots.txt را بسازید
سادهترین ساختار، اجازه خزش کامل به همه رباتها و اعلام موقعیت sitemap است:
- User-agent: *
- Allow: /
- Sitemap: https://yourdomain.com/sitemap.xml
در اینجا User-agent: * یعنی همه رباتها و Allow: / یعنی اجازه خزش کل سایت. خط Sitemap هم موقعیت نقشه سایت را اعلام میکند. برای سایتهای جدید که میخواهید سریع ایندکس شوند، این ساختار معمولاً نقطه شروع خوبی است.
۲. بخشهایی که نمیخواهید خزش شوند را مشخص کنید
لازم نیست همه صفحات خزش شوند. صفحات شخصی کاربر، صفحات موقتی، صفحات تکراری یا صفحات کمارزش سئو را میتوان با robots.txt محدود کرد. مثال:
- Disallow: /wp-admin/
- Disallow: /cart/
- Disallow: /checkout/
- Disallow: /search/
- Disallow: /test/
در وردپرس بستن پوشه /wp-admin/ رایج است، اما برای کارکرد درست برخی فایلهای AJAX باید اجازه دسترسی به /wp-admin/admin-ajax.php را بدهید. بنابراین ساختار مناسب وردپرس به این شکل میشود:
- User-agent: *
- Disallow: /wp-admin/
- Allow: /wp-admin/admin-ajax.php
- Sitemap: https://yourdomain.com/sitemap.xml
در این مثال پنل مدیریت بسته میشود اما AJAX مورد نیاز قالب و افزونهها باز میماند. برای اجرای سریعتر و پایدارتر وردپرس میتوانید WordPress Hosting را هم بررسی کنید.
۳. کنترل پارامترها و فیلترها در فروشگاههای آنلاین
در فروشگاههای آنلاین، فیلتر رنگ، سایز، قیمت، موجودی و مرتبسازی آدرسهای زیادی تولید میکنند. مثلاً /kafsh?color=black، /kafsh?size=42. اگر این موضوع کنترل نشود، ربات گوگل هزاران صفحه کمارزش پارامتری را میخزد.
برای این بخشها بهتر است robots.txt را همراه با تگ کانونیکال و دادههای گوگل سرچ کنسول بررسی کنید. بستن همه پارامترها با robots.txt همیشه راهحل درست نیست چون برخی صفحات فیلتر ممکن است نیت تجاری داشته باشند و ارزش ایندکس شدن داشته باشند.
۴. فایلهای CSS و JavaScript را نبندید
در سئوی مدرن گوگل صفحات را نه فقط به صورت HTML خام، بلکه به صورت رندرشده بررسی میکند. بستن CSS و JavaScript باعث میشود گوگل ساختار صفحه، سازگاری موبایل و نحوه بارگذاری محتوا را بهدرستی درک نکند. دستورهایی مثل Disallow: /assets/ یا Disallow: /js/ امروز ریسکی محسوب میشوند.
رویکرد ایمن در سال ۲۰۲۶ این است: فایلهای CSS، JS، تصاویر و فونت که تجربه کاربری را میسازند باید برای رباتها باز باشند. فقط پوشههای مدیریتی، آزمایشی یا خصوصی را محدود کنید.
۵. فایل robots.txt را تست کنید
بعد از آپلود فایل حتماً آن را بررسی کنید. موارد مهم:
- آدرس https://yourdomain.com/robots.txt با کد ۲۰۰ باز میشود؟
- فایل خالی، اشتباه یا متعلق به دامنه دیگری نیست؟
- خط Sitemap آدرس درست را نشان میدهد؟
- صفحات مهم دستهبندی، محصول و وبلاگ بسته نشدهاند؟
- CSS، JS و تصاویر به اشتباه محدود نشدهاند؟
با ابزار URL Inspection در گوگل سرچ کنسول میتوانید قابلیت خزش صفحات مهم را چک کنید. تحلیل لاگ سرور هم روش پیشرفتهتری برای دیدن رفتار گوگلبات است. برای عملکرد قوی سرور میتوانید VPS Server یا Corporate Hosting را در نظر بگیرید.
چگونه فایل sitemap بسازیم؟
هدف از ساخت sitemap این است که فهرست تمیز و باکیفیتی از آدرسهای مهم و قابل ایندکس به موتور جستجو بدهید. لازم نیست همه صفحات در sitemap باشند. حتی اضافه کردن صفحات noindex، ریدایرکتشده یا خطادار میتواند سیگنال منفی بفرستد.
۱. فقط آدرسهای قابل ایندکس را اضافه کنید
صفحاتی که در sitemap قرار میگیرند باید این شرایط را داشته باشند:
- کد وضعیت ۲۰۰ برگردانند.
- تگ noindex نداشته باشند.
- با robots.txt محدود نشده باشند.
- تگ کانونیکال به خودشان یا آدرس درست اشاره کند.
- محتوای منحصربهفرد و ارزشمند داشته باشند.
- موبایلفرندلی و سریع باشند.
بنابراین صفحات محصول حذفشده، محصولات ناموجود که دائماً حذف شدهاند، نتایج جستجوی داخلی، سبد خرید و صفحات پرداخت نباید در sitemap باشند. در عوض صفحات دستهبندی اصلی، زیرمجموعههای مهم، خدمات، مقالات وبلاگ و محصولات فعال باید اضافه شوند.
۲. فرمت XML را درست به کار ببرید
ساختار ساده XML sitemap به این شکل است:
- <urlset> تگ اصلی است.
- <url> برای هر صفحه یک بلاک جداگانه.
- <loc> آدرس کامل صفحه را نگه میدارد.
- <lastmod> تاریخ آخرین بهروزرسانی را نشان میدهد.
مثال: <loc>https://yourdomain.com/services/</loc> و <lastmod>2026-01-15</lastmod>. فرمت تاریخ بهتر است سال-ماه-روز باشد. بهروزرسانی خودکار و واقعی lastmod مهم است؛ بهروز کردن مصنوعی تاریخ همه آدرسها هر روز کار درستی نیست.
۳. در سایتهای بزرگ sitemap را تقسیم کنید
هر فایل XML sitemap حداکثر ۵۰٬۰۰۰ آدرس و ۵۰ مگابایت حجم uncompressed داشته باشد. در سایتهای بزرگ بهتر است از sitemap index استفاده کنید. مثلاً:
- /post-sitemap.xml
- /page-sitemap.xml
- /product-sitemap.xml
- /category-sitemap.xml
- /image-sitemap.xml
این روش هم پردازش را برای موتور جستجو آسانتر میکند و هم تحلیل مشکلات ایندکس هر نوع محتوا را سادهتر میسازد.
۴. ساخت sitemap در وردپرس
وردپرس از نسخه ۵.۵ به بعد نقشه سایت XML داخلی دارد که معمولاً در /wp-sitemap.xml در دسترس است. اما در پروژههای حرفهای افزونههایی مثل Rank Math یا Yoast SEO کنترل دقیقتری ارائه میدهند. با این افزونهها میتوانید تصمیم بگیرید کدام نوع محتوا در sitemap باشد و آیا آرشیو برچسبها نمایش داده شوند یا نه.
اشتباه رایج در وردپرس اضافه کردن صفحات برچسب کمارزش به sitemap است. اگر این صفحات توضیح منحصربهفرد و تقاضای جستجوی واقعی ندارند، بهتر است خارج از sitemap نگه داشته شوند.
۵. اتوماسیون sitemap در سایتهای اختصاصی
در سایتهای اختصاصی بهتر است sitemap بهصورت خودکار تولید شود. هر بار که محصول جدیدی اضافه یا مقالهای منتشر میشود، sitemap هم بهروز شود. توسعهدهندگان باید این قوانین را رعایت کنند:
- صفحات منتشرشده خودکار اضافه شوند.
- صفحات حذفشده یا ۴۰۴ از sitemap حذف شوند.
- صفحات noindex وارد sitemap نشوند.
- آدرسهای کانونیکال متفاوت با دقت مدیریت شوند.
- lastmod فقط هنگام تغییر واقعی محتوا بهروز شود.
این اتوماسیون بهخصوص برای سایتهای خبری، آگهی، رزرو و فروشگاه آنلاین حیاتی است.
چگونه آدرس sitemap را در robots.txt اعلام کنیم؟
بهترین کار این است که آدرس sitemap را در انتهای robots.txt اضافه کنید تا رباتها سریعتر آن را پیدا کنند:
- User-agent: *
- Allow: /
- Sitemap: https://yourdomain.com/sitemap.xml
اگر چند فایل sitemap دارید، هر کدام را در خط جداگانه بنویسید:
- Sitemap: https://yourdomain.com/post-sitemap.xml
- Sitemap: https://yourdomain.com/product-sitemap.xml
اگر سایتتان HTTPS است، آدرسهای داخل sitemap هم باید HTTPS باشند و از ترکیب www و non-www اجتناب کنید.
ارسال sitemap به گوگل سرچ کنسول

بعد از ساخت sitemap باید آن را از طریق گوگل سرچ کنسول ارسال کنید:
- به گوگل سرچ کنسول وارد شوید.
- مورد نظر را انتخاب کنید (ترجیحاً property نوع دامنه).
- از منوی سمت چپ بخش Sitemaps را باز کنید.
- آدرس sitemap را وارد کنید (مثلاً sitemap.xml).
- دکمه Submit را بزنید.
- وضعیت را چک کنید و تعداد آدرسهای کشفشده را ببینید.
ارسال sitemap به معنای ایندکس فوری همه صفحات نیست. گوگل ابتدا آدرسها را کشف، خزش و پردازش میکند و سپس بر اساس سیگنالهای کیفی تصمیم به ایندکس میگیرد.
اشتباهات رایج در robots.txt و sitemap
۱. بستن کل سایت به اشتباه
بزرگترین اشتباه گذاشتن دستور Disallow: / روی سایت زنده است. این دستور همه چیز را میبندد. اگر این تنظیم از محیط توسعه به سایت اصلی منتقل شود، گوگل هیچ صفحه جدیدی را نخواهد خزید.
۲. اضافه کردن صفحات noindex به sitemap
دادن تگ noindex و همزمان قرار دادن صفحه در sitemap سیگنال متناقض ایجاد میکند. sitemap میگوید «این صفحه مهم است» و noindex میگوید «ایندکس نکن». بنابراین فقط صفحاتی را در sitemap بگذارید که واقعاً میخواهید ایندکس شوند.
۳. نگه داشتن آدرسهای ۳۰۱، ۴۰۴ یا ۵۰۰ در sitemap
آدرسهای داخل sitemap باید کد ۲۰۰ برگردانند. آدرسهای ریدایرکتشده، حذفشده یا خطادار را بهصورت ماهانه پاک کنید.
۴. استفاده از پروتکل یا دامنه اشتباه
اگر سایتتان روی https://www.yourdomain.com است، همه آدرسهای sitemap هم باید دقیقاً همین فرمت را داشته باشند.
۵. ارسال تعداد زیاد آدرس بیکیفیت
sitemap سطل زباله نیست. فقط صفحات باکیفیت و ارزشمند را اضافه کنید تا سیگنال تمیزتری به موتور جستجو بفرستید.
چکلیست سئوی فنی برای سال ۲۰۲۶
هنگام آمادهسازی robots.txt و sitemap این موارد را بررسی کنید:
- فایل robots.txt در ریشه سایت در دسترس است؟
- آدرس sitemap داخل robots.txt درست اعلام شده؟
- صفحات مهم با robots.txt بسته نشدهاند؟
- فایلهای CSS، JavaScript و تصاویر قابل خزش هستند؟
- sitemap فقط شامل آدرسهای ۲۰۰ و قابل ایندکس است؟
- صفحات noindex خارج از sitemap نگه داشته شدهاند؟
- تاریخ lastmod واقعی است؟
- در سایتهای بزرگ از sitemap index استفاده شده؟
- گوگل سرچ کنسول sitemap را با موفقیت پردازش کرده؟
سئوی فنی فقط ساخت فایل نیست. عملکرد هاست، تنظیم SSL، DNS، ریدایرکتها و سرعت سرور هم تأثیر مستقیم دارند. بنابراین هنگام برنامهریزی زیرساخت، Hosting Packages، د ډومین لیږد و Website Security را با هم در نظر بگیرید.
مثال استراتژی robots.txt و sitemap
برای یک وبسایت شرکتی ساده، صفحات اصلی، خدمات، درباره ما، تماس و مقالات وبلاگ در sitemap قرار میگیرند و پنل مدیریت، صفحات تشکر فرم و تستهای موقتی با robots.txt یا noindex کنترل میشوند. در فروشگاه آنلاین متوسط بهتر است sitemap محصولات، دستهبندیها و مقالات را جدا کنید و محصولات حذفشده را خارج کنید. در سایتهای خبری هم تاریخ انتشار واقعی و بهروزرسانیهای معنادار مهمترین سیگنال برای گوگل هستند.
سؤالات متداول
آیا robots.txt ایندکس شدن را کاملاً متوقف میکند؟
خیر. robots.txt فقط خزش را محدود میکند. اگر صفحه از سایتهای دیگر لینک بگیرد، گوگل ممکن است بدون خزش هم آن را ایندکس کند. برای جلوگیری قطعی از ایندکس معمولاً از تگ noindex استفاده میشود.
آیا sitemap باعث رتبه بهتر در گوگل میشود؟
sitemap بهتنهایی رتبه تضمینی نمیدهد، اما کشف سریعتر صفحات و ارسال سیگنال بهروزرسانی را آسانتر میکند. رتبهبندی نهایی به کیفیت محتوا، بکلینک، تجربه کاربری و سرعت بستگی دارد.
آیا اعلام sitemap در robots.txt الزامی است؟
الزامی نیست ولی توصیه میشود. همچنین ارسال مستقیم sitemap از گوگل سرچ کنسول هم کار خوبی است.
آدرس پیشفرض sitemap در وردپرس چیست؟
معمولاً /wp-sitemap.xml. اگر از افزونه سئو استفاده میکنید ممکن است آدرس /sitemap_index.xml یا /sitemap.xml باشد.
حداکثر تعداد آدرس در یک sitemap چقدر است؟
هر فایل XML حداکثر ۵۰٬۰۰۰ آدرس و ۵۰ مگابایت حجم uncompressed. برای سایتهای بزرگ از sitemap index استفاده کنید.
نتیجهگیری
robots.txt و sitemap دو بخش کوچک اما بسیار مؤثر از سئوی فنی هستند. robots.txt رفتار خزش رباتها را هدایت میکند و sitemap کشف آدرسهای مهم را سرعت میبخشد. با تنظیم درست، صفحات کلیدی را باز بگذارید، بخشهای غیرضروری را هوشمندانه ببندید، فقط آدرسهای قابل ایندکس را در sitemap قرار دهید و بهصورت منظم در گوگل سرچ کنسول پیگیری کنید.
برای داشتن پایه فنی محکم، از هاستینگ مطمئن، مدیریت درست دامنه و SSL استفاده کنید. راهحلهای د ویب کوربه توب، ډومین و SSL Certificate هاست راگونس را بررسی کنید تا زیرساختی سریع، امن و سازگار با سئو داشته باشید.