BEACON Herramienta gratuita

¿Su sitio está bloqueando a los rastreadores de IA?

Si su robots.txt deniega el acceso a GPTBot, PerplexityBot, ClaudeBot o Google-Extended, esos motores no pueden leer su sitio y no lo recomendarán. Pegue su URL para obtener una lectura real de su robots.txt en vivo y ver exactamente qué rastreadores de IA están permitidos o bloqueados. Sin registro.

https://
GPTBot (ChatGPT)Comprueba si el rastreador de OpenAI tiene permiso para leer y aprender de sus páginas.
PerplexityBotConfirma si Perplexity puede acceder a su contenido para citarle en sus respuestas.
ClaudeBotComprueba el acceso del rastreador de Anthropic para Claude.
Google-ExtendedEl control que decide si su contenido alimenta a Gemini y las funciones de IA de Google.
Lee su robots.txt en vivoUna obtención real de su /robots.txt actual, no una suposición en caché ni un resultado inventado.
También llms.txtTambién informa de si publica un /llms.txt para guiar a los motores de IA hacia su mejor contenido.

Por qué importa el acceso de los rastreadores de IA

Los motores de IA solo pueden recomendar lo que pueden leer. Una sola línea Disallow demasiado amplia en el robots.txt puede eliminarle silenciosamente de ChatGPT, Perplexity, Claude y Gemini: uno de los errores de visibilidad más comunes e invisibles.

  • GPTBot — OpenAI / ChatGPT
  • OAI-SearchBot — búsqueda de ChatGPT
  • PerplexityBot — Perplexity
  • ClaudeBot — Anthropic / Claude
  • Google-Extended — Gemini y funciones de IA de Google

Permitir o bloquear: usted decide

Algunos sitios bloquean deliberadamente a los rastreadores de IA para proteger su contenido; la mayoría desea la visibilidad. En cualquier caso, debería conocer su estado actual. Esta herramienta simplemente informa de lo que dice su robots.txt hoy, para que la decisión sea informada y no accidental.

Cómo desbloquear los rastreadores de IA

Si un rastreador está bloqueado, elimine o restrinja la regla Disallow correspondiente a ese user-agent en el robots.txt y vuelva a comprobar. Una vez corregido el acceso, asegúrese de que su contenido esté en HTML estático (no solo en JavaScript) para que los rastreadores realmente lo vean: una cuenta gratuita de Beacon mide ese desfase de renderizado (Render Gap) en todo su sitio.

FAQ

¿Cómo sé si GPTBot está bloqueado?

Pegue su URL más arriba. Beacon lee su robots.txt en vivo e informa de si GPTBot, PerplexityBot, ClaudeBot y Google-Extended están permitidos o denegados.

¿Debería bloquear los rastreadores de IA?

Depende de sus objetivos. Bloquearlos protege el contenido de que se use para entrenamiento y respuestas, pero también le elimina de las recomendaciones de IA. La mayoría de las marcas que buscan visibilidad deberían permitirlos.

¿Este resultado es preciso?

Sí: es una obtención real de su /robots.txt en el momento de la comprobación, analizada para cada user-agent de IA. Nada está inventado.

¿Y el contenido renderizado con JavaScript?

Permitir los rastreadores es el primer paso; también necesitan un HTML legible. Si su contenido solo aparece después de que se ejecute JavaScript, los rastreadores ven un caparazón vacío. Una cuenta gratuita de Beacon mide este desfase de renderizado.

Compruebe ahora el acceso de los rastreadores de IA

Gratis, real y sin registro: vea quién puede leer su sitio.

Empezar gratis Ejecutar una comprobación gratuita