Phân tích tệp robots.txt của trang web; xem trạng thái truy cập của GPTBot, ClaudeBot, Perplexity và 17 trình thu thập dữ liệu AI khác trong thời gian thực.
Các công ty AI (OpenAI, Anthropic, Google, Meta, Amazon, và nhiều công ty khác) sử dụng các bot chuyên dụng để thu thập dữ liệu trên web và huấn luyện các mô hình AI hoặc thực hiện tìm kiếm theo thời gian thực. Các bot này truy cập vào trang web của bạn, robots.txt Điều này được xác định bởi các quy tắc trong tệp của bạn. Tuy nhiên, việc xem bot nào được phép và bot nào bị chặn ở cùng một nơi khá rắc rối.
Công cụ Kiểm soát truy cập AI Bot sẽ xác minh trang web bạn đang truy cập. robots.txt Nó truy xuất tệp từ máy chủ theo thời gian thực và tự động phân tích trạng thái của 17 trình thu thập dữ liệu AI khác nhau: GPTBot, ChatGPT-User, OAI-SearchBot (OpenAI); ClaudeBot, anthropic-ai, Claude-Web (Anthropic); PerplexityBot và Perplexity-User (Perplexity); Google-Extended (Gemini/AI Overview); Applebot-Extended; CCBot (Common Crawl); Bytespider (TikTok); Amazonbot; meta-externalagent và FacebookBot (Meta); DuckAssistBot và cohere-ai. Đối với mỗi bot... Được ủy quyền, Tàn tật hoặc Không được chỉ định (quyền mặc định) Bạn có thể xem trạng thái của họ thông qua các huy hiệu màu sắc.
Màn hình kết quả cũng bao gồm tùy chọn sẵn sàng tắt cho các bot AI. robots.txt Các ví dụ về quy tắc cũng được cung cấp. Bạn cũng có thể sử dụng nó để nghiên cứu chính sách của bất kỳ trang web nào nếu bạn không phải là chủ sở hữu trang web đó. Tất cả các truy vấn đều được thực hiện ở phía máy chủ; các yêu cầu chỉ được gửi đến các địa chỉ IP công cộng, các khối mạng cục bộ và mạng riêng tư bị chặn vì lý do bảo mật.
ví dụ.com hoặc https://example.com).robots.txt Nó truy xuất tập tin.robots.txt Thêm nó vào tệp.