Suriin ang robots.txt file ng iyong site; tingnan ang katayuan ng pag-access ng GPTBot, ClaudeBot, Perplexity, at 17 pang iba pang AI crawler nang real time.
Ang mga kompanya ng AI (OpenAI, Anthropic, Google, Meta, Amazon, at iba pa) ay gumagamit ng mga espesyalisadong bot upang i-crawl ang web at sanayin ang mga modelo ng AI o magsagawa ng mga real-time na paghahanap. Ina-access ng mga bot na ito ang iyong site, robots.txt Ito ay natutukoy ng mga patakaran sa iyong file. Gayunpaman, ang pagtingin kung aling mga bot ang pinapayagan at alin ang hinaharangan sa isang lugar ay medyo mahirap.
Bine-verify ng tool na AI Bot Access Control ang website na iyong binibisita. robots.txt Kinukuha nito ang file mula sa server nang real time at awtomatikong sinusuri ang katayuan ng 17 iba't ibang AI crawler: GPTBot, ChatGPT-User, OAI-SearchBot (OpenAI); ClaudeBot, anthropic-ai, Claude-Web (Anthropic); PerplexityBot at Perplexity-User (Perplexity); Google-Extended (Gemini/AI Overview); Applebot-Extended; CCBot (Common Crawl); Bytespider (TikTok); Amazonbot; meta-externalagent at FacebookBot (Meta); DuckAssistBot at cohere-ai. Para sa bawat bot... Awtorisado, May kapansanan o Hindi tinukoy (default na pahintulot) Makikita mo ang kanilang katayuan gamit ang mga may kulay na badge.
Kasama rin sa screen ng mga resulta ang isang opsyon na handa nang i-off para sa mga AI bot. robots.txt May mga halimbawang tuntunin din na ibinigay. Maaari mo rin itong gamitin upang saliksikin ang patakaran ng anumang site kung hindi ikaw ang may-ari ng site. Lahat ng query ay nasa server-side; ang mga kahilingan ay ipinapadala lamang sa mga pampublikong IP address, ang mga lokal at pribadong pagharang sa network ay hinaharangan para sa mga kadahilanang pangseguridad.
halimbawa.com o https://example.com).robots.txt Kinukuha nito ang file.robots.txt Idagdag ito sa file.