Question 1

¿Qué es un archivo robots.txt?

Accepted Answer

Un archivo robots.txt es un archivo de texto plano ubicado en la raíz de tu sitio web (p. ej. example.com/robots.txt) que indica a los crawlers de los motores de búsqueda qué páginas o secciones pueden o no pueden rastrear. Sigue el Robots Exclusion Protocol, un estándar usado por todos los principales motores de búsqueda, incluidos Google, Bing y Yahoo. El archivo contiene directivas como User-agent, Disallow, Allow y Sitemap para controlar el comportamiento del crawler.

Question 2

¿Robots.txt impide que las páginas se indexen?

Accepted Answer

No. Una directiva Disallow en robots.txt indica a los crawlers que no rastreen una página, pero no impide que esa página aparezca en los resultados de búsqueda. Si otros sitios enlazan a una URL bloqueada, Google aún puede indexarla basándose en información externa como el texto ancla. Para impedir realmente la indexación, usa una etiqueta meta noindex o un encabezado HTTP X-Robots-Tag. Robots.txt controla el rastreo, no la indexación.

Question 3

¿Dónde debo colocar mi archivo robots.txt?

Accepted Answer

Tu archivo robots.txt debe colocarse en el directorio raíz de tu sitio web para que sea accesible en tudomain.com/robots.txt. Debe servirse desde el dominio y protocolo exactos (HTTP o HTTPS) a los que deseas que se aplique. Por ejemplo, https://example.com/robots.txt solo se aplica a https://example.com, no a https://www.example.com o http://example.com. Cada subdominio necesita su propio archivo robots.txt.

Question 4

¿Cuáles son las directivas de robots.txt más comunes?

Accepted Answer

Las directivas más comunes son: User-agent (especifica a qué crawler se aplican las reglas, usa * para todos los crawlers), Disallow (bloquea una ruta del rastreo), Allow (permite el rastreo de una ruta específica dentro de un directorio bloqueado), Sitemap (indica a los crawlers la URL de tu sitemap XML), y Crawl-delay (pide a los crawlers esperar varios segundos entre solicitudes, soportado por Bing y Yandex pero no por Google). Estas directivas son sensibles a mayúsculas y deben seguir la sintaxis exacta para funcionar correctamente.

Generador de Robots.txt

Crea tu Robots.txt

Tu archivo Robots.txt

¿Quieres monitorizar tus rankings?

¿Qué es un archivo Robots.txt?

More Free SEO Tools

Preguntas frecuentes

¿Qué es un archivo robots.txt?

¿Robots.txt impide que las páginas se indexen?

¿Dónde debo colocar mi archivo robots.txt?

¿Cuáles son las directivas de robots.txt más comunes?

Generador de Robots.txt

Crea tu Robots.txt

Tu archivo Robots.txt

¿Quieres monitorizar tus rankings?

¿Qué es un archivo Robots.txt?

More Free SEO Tools

Preguntas frecuentes

¿Qué es un archivo robots.txt?

¿Robots.txt impide que las páginas se indexen?

¿Dónde debo colocar mi archivo robots.txt?

¿Cuáles son las directivas de robots.txt más comunes?

Herramientas relacionadas

Probador de Robots.txt

Generador de Sitemap

Probador de acceso de bots de IA

Generador de Meta Tags