Analiza el archivo robots.txt de tu sitio web; consulta el estado de acceso de GPTBot, ClaudeBot, Perplexity y otros 17 rastreadores de IA en tiempo real.
Las empresas de IA (OpenAI, Anthropic, Google, Meta, Amazon y más) utilizan bots especializados para rastrear la web y entrenar modelos de IA o realizar búsquedas en tiempo real. Estos bots acceden a su sitio, robots.txt Esto viene determinado por las reglas de tu archivo. Sin embargo, consultar en un solo lugar qué bots están permitidos y cuáles están bloqueados resulta bastante engorroso.
La herramienta de control de acceso mediante bots de IA verifica el sitio web que está visitando. robots.txt Recupera el archivo del servidor en tiempo real y analiza automáticamente el estado de 17 rastreadores de IA diferentes: GPTBot, ChatGPT-User, OAI-SearchBot (OpenAI); ClaudeBot, anthropic-ai, Claude-Web (Anthropic); PerplexityBot y Perplexity-User (Perplexity); Google-Extended (Gemini/AI Overview); Applebot-Extended; CCBot (Common Crawl); Bytespider (TikTok); Amazonbot; meta-externalagent y FacebookBot (Meta); DuckAssistBot y cohere-ai. Para cada bot... Autorizado, Desactivado o No especificado (permiso predeterminado) Puedes ver su estado mediante insignias de colores.
La pantalla de resultados también incluye una opción para desactivar por completo los bots de IA. robots.txt También se proporcionan ejemplos de reglas. Si no eres el propietario del sitio, puedes usarlo para consultar la política de cualquier sitio web. Todas las consultas se realizan en el servidor; las solicitudes solo se envían a direcciones IP públicas, y se bloquean las direcciones de red locales y privadas por motivos de seguridad.
ejemplo.com o https://example.com).robots.txt Recupera el archivo.robots.txt Añádelo al archivo.