约定是简单的 Markdown:一个写有你站点名称的 H1、一段简短的引用块摘要,然后是 H2 章节,把指向你最重要页面的链接分组,并各附一行描述。
robots.txt 授予或拒绝爬取访问(在那里允许 GPTBot、PerplexityBot、ClaudeBot 和 Google-Extended)。sitemap.xml 完整列出每个 URL。llms.txt 是编辑层 — 一份简短、按优先级排序、人类可读的指南,说明真正重要的是什么。三者都用;它们不冲突。
老实说:它低成本、低风险,但各引擎的采用仍不均衡,因此别指望它单凭一己之力带来戏剧性效果。先优先做好基础 — 解除对 AI 爬虫的屏蔽、修复渲染差距、添加结构化数据 — 然后把 llms.txt 作为收尾点缀。
一个放在你网站根目录(/llms.txt)的拟议 Markdown 文件,为 AI 模型提供一份精选、按优先级排序的最重要内容地图,以及如何阅读它。
不一样。robots.txt 控制爬取权限;llms.txt 是指向你最佳内容的编辑指南。它们是互补的。
支持正在兴起且各引擎不一 — 它还不是一个有保证的通用标准。它是一项廉价、明智的补充,但要先修好可爬取性、渲染和架构。
运行 Beacon 的免费 AI 可见性检测 — 它会连同你的 AI 爬虫访问权限和页面信号一并报告 /llms.txt 是否存在。