Question 1

抓取与渲染的作用是什么？

Accepted Answer

抓取与渲染使用特定机器人的用户代理字符串（如 Googlebot 或 GPTBot）下载网页，并在无头浏览器中执行其 JavaScript。它返回原始源代码、完整渲染的 HTML、可视化截图、所有加载的资源（脚本、样式表、图片、字体、API 调用）、HTTP 响应头以及提取的 SEO 标签。这样您就能看到搜索引擎或 AI 机器人访问页面时看到的全部内容。

Question 2

为什么我的页面在 Googlebot 与普通浏览器中显示不同？

Accepted Answer

多种因素可能导致差异。服务器可能检测到 Googlebot 的用户代理并提供不同内容（欺骗），您的 JavaScript 在爬取环境中可能执行失败，资源可能被 robots.txt 阻止，或页面依赖于机器人没有的 Cookie 或身份验证。使用此工具可帮助您识别 Googlebot 接收到的内容与普通访客看到的内容之间的具体差异。

Question 3

源代码与渲染后 HTML 有何区别？

Accepted Answer

源代码是服务器在任何 JavaScript 执行之前返回的原始 HTML。渲染后 HTML 是所有 JavaScript 运行、AJAX 调用完成、动态内容加载后的最终 DOM。对于静态站点两者相同；而对于 JavaScript 密集型站点（React、Angular、Vue），源代码可能仅包含一个壳层 div，而渲染后 HTML 包含全部实际内容。搜索引擎会索引渲染后的 HTML，因此如果内容仅在 JavaScript 执行后出现，确保渲染正常至关重要。

Question 4

我可以测试 GPTBot 和 ClaudeBot 等 AI 机器人如何查看我的页面吗？

Accepted Answer

可以。此工具支持多种用户代理预设，包括 GPTBot（OpenAI）、ClaudeBot（Anthropic）、Googlebot 桌面版、Googlebot 移动版、Bingbot，以及可自行输入任意用户代理字符串的自定义选项。这帮助您验证服务器是否向 AI 爬虫提供不同内容、阻止它们或对其进行不同的重定向。

抓取与渲染

抓取 URL