Question 1

什么是 robots.txt 文件？

Accepted Answer

robots.txt 文件是放置在您网站根目录的纯文本文件，用于告知搜索引擎爬虫哪些页面或章节被允许或不允许爬取。它遵循 Robots Exclusion Protocol，所有主要搜索引擎均认可。文件使用 User-agent、Disallow、Allow、Sitemap 等指令来控制爬虫行为并管理机器人与您站点的交互。

Question 2

robots.txt 能阻止页面被索引吗？

Accepted Answer

不能。robots.txt 中的 Disallow 指令告诉爬虫不要爬取某个页面，但它并不会阻止该页面出现在搜索结果中。如果其他页面链接到被阻止的 URL，Google 仍可根据外部信息（如锚文本）对其进行索引。要真正阻止页面被索引，需要使用 noindex 元标签或 X-Robots-Tag HTTP 响应头。robots.txt 控制爬取，而非索引。

Question 3

我应该把 robots.txt 文件放在哪里？

Accepted Answer

您的 robots.txt 文件必须放置在网站根目录，以便通过 yourdomain.com/robots.txt 访问。它必须从您希望其生效的确切域名和协议（HTTP 或 HTTPS）提供。例如，https://example.com/robots.txt 只适用于 https://example.com，不适用于 https://www.example.com 或 http://example.com。每个子域名都需要自己的 robots.txt 文件。

Question 4

最常用的 robots.txt 指令有哪些？

Accepted Answer

最常用的指令包括：User-agent（指定规则适用于哪个爬虫，使用 * 表示全部爬虫），Disallow（阻止某路径被爬取），Allow（在被阻止的目录中允许特定路径爬取），Sitemap（指向您的 XML sitemap URL），以及 Crawl-delay（要求爬虫在请求之间等待若干秒，Bing 和 Yandex 支持，但 Google 不支持）。这些指令区分大小写，必须严格遵守语法才能正常工作。

Robots.txt 生成器

构建您的 Robots.txt

您的 Robots.txt 文件

想要监控您的排名？

什么是 Robots.txt 文件？

More Free SEO Tools

常见问题

什么是 robots.txt 文件？

robots.txt 能阻止页面被索引吗？

我应该把 robots.txt 文件放在哪里？

最常用的 robots.txt 指令有哪些？

Robots.txt 生成器

构建您的 Robots.txt

您的 Robots.txt 文件

想要 监控您的排名？

什么是 Robots.txt 文件？

More Free SEO Tools

常见问题

什么是 robots.txt 文件？

robots.txt 能阻止页面被索引吗？

我应该把 robots.txt 文件放在哪里？

最常用的 robots.txt 指令有哪些？

相关工具

Robots.txt 测试工具

Sitemap 生成器

AI 机器人访问测试工具

Meta Tag 生成器

想要监控您的排名？