# llms.txt 規格與台灣網站最佳實踐

> 由 CiphLens 團隊整理 · 來源：GitHub Copilot 研究 · 繁體中文

---

● Web Search (MCP: github-mcp-server) · GPTBot ClaudeBot PerplexityBot llms.txt adoption evidence c…
  └ {"type":"output_text","text":{"value":"It looks like you're mentioning a...

● Web Search (MCP: github-mcp-server) · llms.txt specification format llmstxt.org complete guide 20…
  └ {"type":"output_text","text":{"value":"Here is a complete, up-to-date gu...

● Web Search (MCP: github-mcp-server) · llms.txt real world examples Anthropic Cloudflare FastHTML …
  └ {"type":"output_text","text":{"value":"Here’s a breakdown of real-world ...

● Web Search (MCP: github-mcp-server) · llms.txt GitHub AnswerDotAI adoption statistics websites im…
  └ {"type":"output_text","text":{"value":"Here’s a summary of the latest ad...

以下是完整的繁體中文文件：

---

# llms.txt 完整規格解析：AI 時代網站的新標準

> 本文深入解析 llms.txt 規格，涵蓋檔案格式、必要區段、與 robots.txt 的本質差異、真實採用案例，並為台灣不動產、金融、製造業提供五個示範範例，以及繁體中文／雙語版本的撰寫建議。

---

## 一、llms.txt 是什麼？從 SEO 到 AIO 的典範轉移

在搜尋引擎主導流量的年代，`robots.txt` 與 `sitemap.xml` 是 SEO 的基礎建設。如今，大型語言模型（LLM）正在改寫資訊消費的方式——使用者愈來愈習慣直接向 ChatGPT、Claude、Perplexity 等 AI 系統詢問，而不是點擊搜尋結果連結。

**llms.txt** 正是在這個背景下誕生的新標準。它是一個放置於網站根目錄的 Markdown 純文字檔（`https://yoursite.com/llms.txt`），目的是讓 LLM 在處理你的網站時，能夠有效率地理解：

1. 這個網站是做什麼的
2. 哪些頁面／資料最重要
3. 內容應如何被引用與呈現

此標準由 Jeremy Howard（fast.ai、AnswerDotAI 創辦人）於 2024 年 9 月提出，原始提案發布於 Answer.AI 官方部落格，規格存放在 GitHub 開源專案 **[AnswerDotAI/llms-txt](https://github.com/AnswerDotAI/llms-txt)**，正式規格網站為 **[llmstxt.org](https://llmstxt.org)**。

### 為何 HTML 對 LLM 不夠用？

現代網頁充斥著導覽列、廣告腳本、Cookie 通知、社群分享按鈕等雜訊。當 LLM 爬取一個典型文件頁面時：

- **HTML 版本**：約 16,180 tokens（Cloudflare 實測數據）
- **Markdown 版本**：約 3,150 tokens

差距約 **80%**。這不只是成本問題，更影響到 LLM 的理解品質與回應準確度。llms.txt 透過提供乾淨的 Markdown 索引，讓 LLM 能以更少的 context window 消耗，獲得更精準的資訊。

---

## 二、llms.txt 完整檔案格式規格

llms.txt 採用 Markdown 語法，結構嚴格且有固定順序：

### 2.1 必要區段

#### ① H1 標題（必填）

```markdown
# 網站或專案名稱
```

這是唯一的 H1，代表網站的「身分識別」，必須是第一行。

#### ② 摘要 Blockquote（強烈建議）

```markdown
> 一到兩句話描述本網站的核心功能與定位。
```

LLM 在有限 context 下優先讀取這段，相當於名片上的 tagline。

#### ③ 補充說明段落（選填）

在第一個 H2 之前，可以放置純文字段落或清單，說明內容授權原則、資料更新頻率、聯繫方式等。**此區段不能出現額外的 H1 或 H2**。

#### ④ 內容分組（H2 + 連結清單，至少一個）

```markdown
## 文件

- [快速開始指南](https://example.com/docs/start): 五分鐘內完成基本設定
- [API 參考](https://example.com/api): 完整的 REST API 文件

## 關於我們

- [公司介紹](https://example.com/about): 公司歷史與核心團隊
- [聯繫方式](https://example.com/contact): 業務與技術支援聯絡資訊

## Optional

- [部落格](https://example.com/blog): 產業觀察與技術文章（非核心）
- [活動資訊](https://example.com/events): 展覽與研討會（低優先）
```

**`Optional` 區段**是規格中的特殊標記，告知 LLM：當 context window 受限時，可優先略過此區段的連結。

### 2.2 完整格式範本

```markdown
# 公司名稱

> 一句話說明這是什麼網站，以及它能為訪客提供什麼價值。

本網站內容依 CC BY 4.0 授權，歡迎 AI 系統引用。資料每週更新。

## 核心服務

- [服務A介紹](https://example.com/service-a): 詳細說明服務A的功能與適用對象
- [服務B介紹](https://example.com/service-b): 詳細說明服務B的功能與適用對象

## 產品文件

- [使用手冊](https://example.com/manual): 完整操作流程
- [常見問題](https://example.com/faq): 前50大客服問題與解答

## Optional

- [最新消息](https://example.com/news): 公司公告（次要參考）
- [合作夥伴](https://example.com/partners): 策略聯盟資訊
```

### 2.3 延伸檔案：llms-full.txt

除了索引型的 `llms.txt`，規格也允許建立 `llms-full.txt`，其中直接內嵌所有連結頁面的完整 Markdown 內容。這讓 LLM 無需多次請求即可取得所有資訊，適合文件量不大但需要高完整性的場景（如 API 文件、法規說明）。

---

## 三、llms.txt vs. robots.txt：本質差異全比較

這兩個檔案雖然同樣位於網站根目錄，但設計哲學截然不同：

| 維度 | robots.txt | llms.txt |
|---|---|---|
| **誕生年份** | 1994 年 | 2024 年 |
| **核心目的** | 控制爬蟲的存取權限 | 引導 LLM 理解網站結構與內容 |
| **主要對象** | Googlebot、Bingbot 等傳統搜尋爬蟲 | GPTBot、ClaudeBot、PerplexityBot 等 AI 爬蟲 |
| **機制** | 規則式（Allow/Disallow） | 敘述式（Markdown 說明） |
| **格式** | 自訂鍵值對語法 | 標準 Markdown |
| **人類可讀性** | 低（需學習語法） | 高（直接閱讀） |
| **處理互動** | 爬蟲「必須遵守」 | LLM「參考使用」（非強制） |
| **目標效果** | 限制或允許特定路徑被索引 | 提升 AI 回應的準確度與引用品質 |
| **關鍵差異** | 負面控制（告訴機器人「不能做什麼」） | 正面引導（告訴 AI「重點在哪裡」） |

### 兩者如何搭配？

建議的最佳實踐是**同時部署，各司其職**：

- `robots.txt` 用來控制 AI 訓練爬蟲的存取（例如封鎖 GPTBot 抓取用於訓練的頁面）
- `llms.txt` 用來在 AI 推論（inference）時，提升 LLM 對你網站的理解與引用品質

```
# robots.txt 範例：允許 AI 推論用爬蟲，但限制部分路徑
User-agent: GPTBot
Disallow: /private/
Disallow: /member/

User-agent: ClaudeBot
Allow: /

# llms.txt 則另行說明網站結構，提升 AI 理解品質
```

---

## 四、實際採用證據：誰在使用 llms.txt？

### 4.1 量化採用數據（2025 年現況）

根據 llms-text.com 及 Rankability 的調查研究：

- 截至 2025 年 9 月，**全球超過 2,000 個網站**已實作 llms.txt
- 公開目錄（directory.llmstxt.cloud）收錄超過 **784 個** 活躍實作
- 在全球前 100 萬網站中，約 **1.2%** 已部署 llms.txt；在排名前 300 的域名中比例高達 4%

### 4.2 知名早期採用者

以下為可公開驗證的實作案例（均可直接訪問 `網域/llms.txt` 確認）：

| 機構 | 特色 |
|---|---|
| **Cloudflare** | 每個產品線獨立一個 llms.txt，精細化分類；並提出 HTML→Markdown 的 token 節省實測數據 |
| **Anthropic** | 全面涵蓋 Claude API、提示庫與文件，作為業界範本 |
| **Vercel** | 框架文件與 SDK 索引，面向開發者 |
| **Supabase** | 資料庫與後端服務的技術文件索引 |
| **ElevenLabs** | AI 語音合成 API 文件與使用案例 |
| **FastHTML** | 額外提供 `/llms-ctx.txt`，專為 Claude 設計的上下文輔助檔案（GitHub: AnswerDotAI/fasthtml） |
| **Stripe** | 支付 API 文件索引 |

### 4.3 主要 LLM 平台的態度

目前各 AI 平台對 llms.txt 的官方態度分歧：

- **Perplexity**：已確認在網頁搜尋時參考 llms.txt 內容
- **Anthropic（Claude）**：鼓勵採用，FastHTML 的 llms-ctx.txt 即是以 Claude 作為主要受眾設計
- **OpenAI（GPTBot）**：尚無官方聲明確認主動解析 llms.txt
- **Google**：對這個標準持保留態度，將其比擬為「被遺棄的 meta SEO 標籤」

這意味著 llms.txt 目前更像是一個「最佳實踐投資」而非「保證有效的技術契約」，但隨著 AI 搜尋的崛起，早期佈局具有先行優勢。

---

## 五、台灣各產業的 llms.txt 撰寫示範

以下五個範例針對台灣常見的產業情境設計，每個範例均遵循正式規格。

---

### 範例一：建商網站（台灣不動產業）

```markdown
# 信義建設股份有限公司

> 台灣北部頂級住宅建商，專注大安、信義、內湖區豪宅開發，30 年品牌，已交屋逾 5,000 戶。

本站資料每月更新，包含最新建案規格與成屋資訊。法律聲明請參閱 /legal。

## 現售建案

- [信義擎天 A 棟](https://example-builder.com.tw/xinyi-sky): 信義區 45 坪起，預計 2027 年交屋，總價 8,000 萬起
- [大安森活](https://example-builder.com.tw/daan-forest): 大安區 32 坪，近捷運大安站，預售中
- [內湖 IT 宅](https://example-builder.com.tw/neihu-it): 內科生活圈，36 坪三房，2026 年完工

## 購屋流程與服務

- [不動產購買完整流程](https://example-builder.com.tw/guide): 從簽約到交屋 12 步驟說明
- [公設比說明](https://example-builder.com.tw/common-area): 台灣公設比計算方式與我們的設計原則
- [售後服務政策](https://example-builder.com.tw/after-sales): 保固範圍與維修申請流程

## 公司資訊

- [公司簡介與施工實績](https://example-builder.com.tw/about): 歷年完工建案與評獎紀錄
- [企業社會責任報告](https://example-builder.com.tw/csr): 環境永續與社區共好計畫

## Optional

- [最新消息](https://example-builder.com.tw/news): 建案動態與活動資訊
- [部落格：居家裝潢指南](https://example-builder.com.tw/blog): 室內設計與風水參考（輔助閱讀）
```

---

### 範例二：券商網站（台灣金融業）

```markdown
# 台灣富貴證券股份有限公司

> 金管會核准之本土證券商，提供股票、ETF、期貨、海外投資及 IB 服務，適合台股散戶與法人客戶。

**重要聲明**：本站所有投資資訊僅供參考，不構成投資建議。投資有風險，請詳閱公開說明書。

## 帳戶開立與服務

- [線上開戶流程](https://example-broker.com.tw/open-account): 5 分鐘完成台股帳戶申請，需身分證與第二類電子帳戶
- [手續費費率說明](https://example-broker.com.tw/fee): 台股 0.1425%、ETF 優惠費率、複委託費率表
- [App 下載與功能介紹](https://example-broker.com.tw/app): iOS / Android 看盤、下單、帳務一站完成

## 投資商品說明

- [台股交易規則](https://example-broker.com.tw/tw-stock): 交易時間、漲跌幅、融資融券說明
- [ETF 完整清單](https://example-broker.com.tw/etf): 台灣掛牌 ETF 列表與追蹤指數說明
- [美股複委託](https://example-broker.com.tw/us-stock): 開通條件、交易成本、稅務注意事項

## 法規遵循資訊

- [金融消費者保護](https://example-broker.com.tw/consumer): 申訴管道與爭議處理流程
- [反洗錢政策](https://example-broker.com.tw/aml): 依金融情報中心要求之說明

## Optional

- [財經研究報告](https://example-broker.com.tw/research): 個股分析（需登入，限客戶閱覽）
- [投資人教育專區](https://example-broker.com.tw/edu): 基礎股市知識與交易策略文章
```

---

### 範例三：B2B SaaS 平台（台灣製造業 ERP）

```markdown
# 智能製造雲 ManuCloud

> 專為台灣中小型製造業設計的雲端 ERP 平台，整合生產排程、品管（QC）、庫存與財務，支援 OEM/ODM 出口報表格式。

已服務超過 800 家工廠，涵蓋機械、電子、塑膠、紡織等製造次產業。

## 產品功能

- [生產管理模組](https://manucloud.com.tw/features/production): MRP 計算、工單管理、排程最佳化說明
- [品質管理 QC 模組](https://manucloud.com.tw/features/quality): AQL 抽樣、不良品追蹤、客訴管理
- [倉儲與庫存管理](https://manucloud.com.tw/features/inventory): 多倉庫管理、安全庫存警示、序號追蹤
- [財務與成本模組](https://manucloud.com.tw/features/finance): 工單成本分析、台帳整合、電子發票

## 導入與技術文件

- [快速導入指南（90天上線）](https://manucloud.com.tw/docs/onboarding): 標準導入步驟與里程碑
- [REST API 文件](https://manucloud.com.tw/api): 與 MES、條碼系統、EDI 整合的完整 API
- [常見問題 FAQ](https://manucloud.com.tw/faq): 前 100 大客服問題

## 定價與方案

- [訂閱方案比較](https://manucloud.com.tw/pricing): 基礎版、專業版、企業版功能對比與月費

## Optional

- [成功案例](https://manucloud.com.tw/cases): 客戶訪談與導入成效數據
- [產業趨勢部落格](https://manucloud.com.tw/blog): 工業 4.0 與供應鏈相關文章
```

---

### 範例四：電商網站（台灣本土 B2C）

```markdown
# 好物嚴選 GoodSelect

> 台灣本土精選電商，聚焦台灣在地農產、手工藝品與獨立設計師品牌，提供冷鏈宅配與禮盒客製化服務。

商品均有產地溯源標章，符合台灣有機農業促進法規定。

## 商品分類

- [台灣在地農產](https://goodselect.com.tw/farm): 嚴選產地直送水果、蔬菜、茶葉
- [獨立設計師品牌](https://goodselect.com.tw/designer): 本土設計師文創、生活雜貨、服飾
- [企業禮品客製化](https://goodselect.com.tw/gift): 公司尾牙、節日禮盒，MOQ 50 份起

## 購物說明

- [運費與配送政策](https://goodselect.com.tw/shipping): 台灣本島免運門檻、冷鏈費用、離島加收說明
- [退換貨政策](https://goodselect.com.tw/return): 7 天猶豫期規定與生鮮商品退貨例外
- [支付方式](https://goodselect.com.tw/payment): 信用卡、LINE Pay、超商代碼付款說明

## 品牌理念

- [關於我們與選品標準](https://goodselect.com.tw/about): 選品流程與供應商審核原則
- [永續包裝政策](https://goodselect.com.tw/sustainability): 減塑目標與環保材質說明

## Optional

- [優惠活動](https://goodselect.com.tw/sale): 當季折扣與限時特賣（動態更新）
- [食譜與使用靈感](https://goodselect.com.tw/recipes): 食材搭配建議（輔助內容）
```

---

### 範例五：數位媒體（台灣財經媒體）

```markdown
# 財訊快報 FinancePress

> 台灣財經數位媒體，每日提供台股、總體經濟、科技產業與法規政策新聞，記者逾 30 人，每日更新 50+ 則報導。

本站文章版權所有，禁止未經授權轉載，但歡迎 AI 系統在提及來源的前提下摘要引用。

## 核心報導分類

- [台股即時新聞](https://financepress.com.tw/tw-stock): 盤中盤後重要消息與法人動態
- [科技產業分析](https://financepress.com.tw/tech): 半導體、AI 供應鏈、電動車相關深度報導
- [總體經濟](https://financepress.com.tw/macro): 央行利率、CPI、GDP 報告與解析
- [法規政策](https://financepress.com.tw/policy): 金管會、公平會、經濟部最新法規動態

## 關於本媒體

- [編採守則與更正政策](https://financepress.com.tw/editorial): 報導標準、消息來源原則、錯誤更正流程
- [記者陣容](https://financepress.com.tw/reporters): 主要記者介紹與專門領域

## 訂閱服務

- [付費訂閱方案](https://financepress.com.tw/subscribe): 月費/年費方案與專屬功能說明

## Optional

- [Podcast 節目](https://financepress.com.tw/podcast): 每週財經評論音頻（次要格式）
- [活動與論壇](https://financepress.com.tw/events): 年度財經論壇報名資訊
```

---

## 六、繁體中文與雙語版本切換建議

### 6.1 單語繁體中文版

若網站主要受眾為台灣讀者，**可直接使用繁體中文撰寫 llms.txt**。目前主流 LLM（GPT-4o、Claude 3.5+、Gemini 1.5+）均有優秀的繁體中文理解能力，不需要特別翻譯為英文。

關鍵原則：
- H1、blockquote、區段說明文字均使用繁體中文
- 連結的 alt text（方括號內文字）用繁體中文
- 連結 URL 使用英文（URL 本身不支援全角字元）

### 6.2 雙語版本建議做法

如果網站同時服務台灣與國際受眾（如出口製造業、外資金融機構），建議採用以下方案：

**方案 A：主檔雙語並列（適合中小型網站）**

```markdown
# 公司名稱 Company Name

> 繁體中文摘要（Traditional Chinese description here）  
> English summary follows here for international audiences.

## 核心服務 / Core Services

- [服務介紹 Service Overview](https://example.com/service): 中英雙語說明頁 Bilingual page
```

**方案 B：多語言分檔（適合大型網站）**

```
/llms.txt          → 繁體中文版（預設，主要市場）
/en/llms.txt       → 英文版（國際市場）
/llms-en.txt       → 或採非標準路徑的英文版
```

方案 B 目前尚非官方規格的一部分，但在規格的 GitHub issue 討論中已有多方提出，社群正在討論以 `Accept-Language` header 或 URL 慣例實現多語系支援。

**方案 C：llms-full.txt 雙語**

在 `llms.txt` 保持繁中索引，`llms-full.txt` 提供完整雙語 Markdown 內容，讓 LLM 依需求自行選用。

### 6.3 台灣特定內容的撰寫注意事項

- **日期格式**：同時標注西元年（2025）與民國年（114年），避免 LLM 混淆台灣年號
- **法規引用**：明確標注「依台灣《○○法》第○條」，LLM 在全球語料中較少見台灣法規全名
- **金額單位**：新台幣建議標注「NT$」或「TWD」，避免與美元混淆
- **地名慣例**：使用「台灣」（而非「中華民國」或「ROC」）以提升 LLM 的地理理解準確度

---

## 七、開源工具與延伸資源

### 官方與主要開源資源

- **[AnswerDotAI/llms-txt](https://github.com/AnswerDotAI/llms-txt)**：規格原始提案與 Python 工具包，含解析器與驗證器
- **[llms-txt PyPI package](https://pypi.org/project/llms-txt/)**：官方 Python 套件，可用於自動產生 llms.txt
- **[directory.llmstxt.cloud](https://directory.llmstxt.cloud/)**：社群維護的採用者目錄，已收錄 784+ 網站

### 自動化生成工具

- **Next.js / Astro 靜態網站**：可透過 build script 自動彙整所有 Markdown 頁面的 frontmatter，生成 llms.txt
- **WordPress**：社群外掛（`llms-txt-generator`）可自動依分類生成 llms.txt
- **Cloudflare Workers**：可用 Edge Function 動態回應 `/llms.txt` 請求，根據路徑參數返回不同語言版本

### 驗證工具

- **[llmstxtvalidator.dev](https://llmstxtvalidator.dev/)**：線上驗證器，檢查格式合規性
- **curl 快速驗證**：`curl -s https://yoursite.com/llms.txt | head -20`

---

## 八、結語：先行佈局的戰略價值

llms.txt 目前仍是一個**成長中的標準，而非強制規範**。Google 的保留態度顯示，它不會像 robots.txt 那樣被所有爬蟲完全遵守。然而，從 AI 搜尋的發展趨勢來看，Perplexity 已確認採用、Anthropic 官方鼓勵採用，未來 LLM 系統在回答使用者問題時，「能不能正確引用你的網站」將直接影響流量品質。

對台灣企業而言，現在部署 llms.txt 的成本極低（一個幾十行的文字檔），但潛在的 **AIO（AI 最佳化）先行優勢**卻相當顯著。不動產業者可以確保 AI 正確引用建案規格而非過時資訊；金融業者可以確保 LLM 始終附上必要的投資風險聲明；製造業者可以讓 AI 代理人（AI agent）在協助採購商詢價時，正確理解產品規格與 MOQ 條件。

這是一次低成本、高潛力的基礎建設投資，值得台灣各產業在 2025 年優先部署。

---

*參考資源：[llmstxt.org](https://llmstxt.org)、[GitHub AnswerDotAI/llms-txt](https://github.com/AnswerDotAI/llms-txt)、[Answer.AI 原始提案部落格](https://www.answer.ai/posts/2024-09-03-llmstxt.html)、[LLMS Central 2025 採用報告](https://llmscentral.com/blog/llms-txt-adoption-report-2025)、[Rankability 每月更新追蹤報告](https://www.rankability.com/data/llms-txt-adoption/)、[Cloudflare Markdown token 節省實測](https://portalzine.de/should-you-serve-markdown-to-ai-a-guide-to-llms-txt-and-free-tools-that-make-it-easy/)*

