# AEO for 新聞媒體 — 新聞網站被 AI 引用的策略

> 由 CiphLens 團隊整理 · 來源：GitHub Copilot 研究 · 繁體中文

---

● Web Search (MCP: github-mcp-server) · NewsArticle schema markup AI citation SEO AEO structured da…
  └ {"type":"output_text","text":{"value":"Certainly! For **news websites** ...

● Web Search (MCP: github-mcp-server) · paywall news AI crawling citation GPTBot ClaudeBot robots.t…
  └ {"type":"output_text","text":{"value":"It looks like you’re asking about...

● Web Search (MCP: github-mcp-server) · AI citation ranking factors perplexity ChatGPT search news …
  └ {"type":"output_text","text":{"value":"Recent research from 2024 and 202...

# 新聞媒體如何成為 AI 搜尋的事實來源：AEO 完全指南

## 前言：從 SEO 到 AEO 的典範轉移

過去十年，新聞媒體的數位競爭場域是搜尋引擎最佳化（SEO）。然而自 2023 年起，隨著 ChatGPT、Perplexity、Google AI Overviews、Microsoft Copilot 等 AI 答案引擎席捲日常資訊消費，一個新的競爭維度已悄然成形：**答案引擎最佳化（Answer Engine Optimization，AEO）**。

對新聞媒體而言，這場典範轉移的賭注遠比一般網站更高。當讀者詢問「台灣今年 GDP 成長率是多少？」或「鴻海最新的財報結果如何？」，AI 所引用的來源，便是在數億用戶面前被認可的「事實權威」。被引用，等同於被信任；不被引用，等同於在 AI 原生世代的讀者面前隱形。

本文從結構化標記、作者權威、引用加分機制、突發事件策略，到台灣主要媒體的現況觀察，以及付費牆對 AI 可見性的影響，提供一套系統性的理解框架與實作指引。

---

## 一、NewsArticle Schema：AI 閱讀新聞的語言

### 1.1 為何結構化資料對 AI 至關重要

AI 搜尋引擎的底層架構多採用**檢索增強生成（Retrieval-Augmented Generation，RAG）**。RAG 系統在生成答案前，會先從外部知識庫或即時爬取的網頁中抽取相關段落，再交由語言模型合成。這個過程中，結構化的 HTML 標記大幅降低了解析成本，讓 AI 能精確識別：誰寫的、何時發布、內容主題為何、原始出處在哪裡。

Schema.org 定義的 `NewsArticle` 類型，正是為此設計。根據 Google 官方文件，`NewsArticle` 是 `Article` 的子類型，針對新聞報導加入了特定欄位，包含 `dateline`（電報日期行）與新聞相關語義標籤。

### 1.2 完整 NewsArticle JSON-LD 實作範例

以下是一個符合 2025 年最佳實踐的完整標記範例，涵蓋 AI 引用所需的所有核心欄位：

```json
{
  "@context": "https://schema.org",
  "@type": "NewsArticle",
  "headline": "台積電第一季淨利創歷史新高，達新台幣 3,615 億元",
  "alternativeHeadline": "TSMC Q1 2025 獲利突破預期，AI 晶片需求強勁",
  "datePublished": "2025-04-17T10:00:00+08:00",
  "dateModified": "2025-04-17T14:30:00+08:00",
  "author": [
    {
      "@type": "Person",
      "name": "林志遠",
      "url": "https://example-news.com.tw/reporter/lin-chih-yuan",
      "sameAs": [
        "https://twitter.com/linchihyuan",
        "https://www.linkedin.com/in/linchihyuan"
      ]
    }
  ],
  "publisher": {
    "@type": "NewsMediaOrganization",
    "name": "範例新聞",
    "url": "https://example-news.com.tw",
    "logo": {
      "@type": "ImageObject",
      "url": "https://example-news.com.tw/logo.png",
      "width": 600,
      "height": 60
    },
    "masthead": "https://example-news.com.tw/about"
  },
  "description": "台積電公布 2025 年第一季財報，淨利達新台幣 3,615 億元，年增 60.3%，超越市場預期，主要受惠於 AI 相關晶片強勁需求。",
  "articleBody": "台積電（TSMC）今日公布...",
  "image": {
    "@type": "ImageObject",
    "url": "https://example-news.com.tw/images/tsmc-q1-2025.jpg",
    "width": 1200,
    "height": 630
  },
  "mainEntityOfPage": {
    "@type": "WebPage",
    "@id": "https://example-news.com.tw/finance/tsmc-q1-2025"
  },
  "isAccessibleForFree": true,
  "isPartOf": {
    "@type": "CreativeWork",
    "name": "財經新聞"
  },
  "about": [
    { "@type": "Organization", "name": "台積電", "sameAs": "https://www.wikidata.org/wiki/Q732022" },
    { "@type": "Thing", "name": "半導體" }
  ],
  "citation": [
    {
      "@type": "CreativeWork",
      "name": "台積電 2025 年第一季法說會簡報",
      "url": "https://investor.tsmc.com"
    }
  ],
  "dateline": "新竹，台灣",
  "inLanguage": "zh-TW"
}
```

### 1.3 關鍵欄位解析

| 欄位 | AI 引用重要性 | 說明 |
|------|-------------|------|
| `datePublished` / `dateModified` | ★★★★★ | 時效性判斷的核心依據 |
| `author` (含 `sameAs`) | ★★★★★ | 連結至 Wikidata/社群媒體強化作者實體識別 |
| `publisher` 使用 `NewsMediaOrganization` | ★★★★☆ | 比一般 `Organization` 更精確標識媒體性質 |
| `isAccessibleForFree` | ★★★★☆ | 直接影響 AI 是否能讀取全文 |
| `about` (含 `sameAs` 指向 Wikidata) | ★★★★☆ | 幫助 AI 建立主題知識圖譜連結 |
| `citation` | ★★★☆☆ | 標示報導引用的原始資料來源 |

開源工具方面，可參考 **[google/structured-data-testing-tool](https://github.com/google/structured-data-testing-tool)**（已封存，但邏輯仍具參考價值）及社群維護的替代品 **[nicholasess/structured-data-testing-tool](https://github.com/nicholasess/structured-data-testing-tool)**，可在本機驗證標記是否符合 Schema.org 規範。另外，**[JayHoltslander/Structured-Data-JSON-LD](https://github.com/JayHoltslander/Structured-Data-JSON-LD)** 提供大量現成模板，適合快速套用。

---

## 二、Author 標記：建立記者的 AI 可識別身份

### 2.1 E-E-A-T 與作者實體的關係

Google 的品質評估框架 E-E-A-T（Experience、Expertise、Authoritativeness、Trustworthiness）不只適用於 Google 搜尋，也逐漸成為 AI 判斷來源可信度的隱性標準。作者的 AI 可識別性（**Entity Salience**）越高，所撰寫的報導被引用的機率越大。

### 2.2 記者實體建立的四個層次

**第一層：Schema 標記中的 `sameAs`**  
將作者的 Schema 標記連結至 Wikidata、LinkedIn、Twitter/X 等可跨域驗證的身份，讓 AI 能確認「林志遠 in 聯合報」與「Lin Chih-yuan at UDN」是同一個實體。

**第二層：Google 搜尋知識面板（Knowledge Panel）**  
若記者有足夠的網路存在感（知名專欄、出版品、演講等），Google 會自動建立知識面板。這意味著該記者已進入 Google 知識圖譜，被 AI 視為已驗證的真實實體。

**第三層：作者個人頁面的結構化資料**  
每位記者應有獨立的 `Person` 頁面，標記其：
- `jobTitle`：記者、主編、駐台北特派員
- `knowsAbout`：財經、半導體、兩岸關係（以 schema.org 的主題實體表示）
- `worksFor`：所屬媒體機構
- `hasCredential`：學術背景或專業認證

**第四層：跨平台一致性**  
AI 的信任判斷源於「多來源交叉驗證」。同一記者在 LinkedIn、Twitter、媒體官網的姓名、頭銜、專業描述必須一致，才能讓 AI 建立穩固的實體連結。

---

## 三、Citation 加分機制：如何讓 AI 選擇你

### 3.1 AI 引用決策的底層邏輯

根據 2025 年學術論文 *"News Source Citing Patterns in AI Search Systems"*（arXiv:2507.05301），AI 搜尋系統在選擇引用來源時，主要考量以下因素：

1. **品牌識別度（Brand Recognition）**：即使沒有反向連結，媒體品牌在訓練資料中出現的頻率決定了其「知名度分數」。這解釋了為何 BBC、Reuters、AP 在 ChatGPT 引用中佔據高度優勢。

2. **內容可抽取性（Extractability）**：AI 偏好能直接找到「答案塊」的文章。研究發現，在文章開頭 100 字內直接回答核心問題，可使引用率顯著提升。

3. **跨平台提及（Cross-Platform Mentions）**：同一報導被 4 個以上來源引用或討論，可大幅提升 AI 的信任度。這創造了「第一個報導者的滾雪球效應」。

4. **時效性（Freshness）**：Perplexity 等即時搜尋 AI 對新鮮度極度敏感。發布後數分鐘內的索引速度，決定了突發事件的引用競爭結果。

### 3.2 結構性寫作策略：為 AI 而寫

**倒金字塔 2.0**：傳統新聞倒金字塔結構本就契合 AI 需求，但需強化「答案前置」的設計：

```markdown
## 台積電 Q1 獲利創新高

**核心事實**（AI 摘要段落）：台積電 2025 年第一季淨利達 3,615 億元新台幣，
年增 60.3%，每股盈餘 13.94 元，優於市場預期的 13.5 元。

**背景**：...（以下正文）
```

**FAQ 區塊**：在文末加入 `FAQPage` schema 的 Q&A 區塊。研究顯示，FAQ 標記可使 AI 引用率提升達 3 倍，因為 AI 的 RAG 系統特別善於提取問答對格式的知識。

**數據表格**：數字型資訊應優先以 HTML `<table>` 呈現，搭配清晰的表頭，而非埋在長段落中。AI 解析表格的效率遠高於敘述性文字。

---

## 四、突發事件的 First-Mover 優勢

### 4.1 時間窗口的決定性作用

在突發事件報導中，「第一個發布可信來源」的媒體享有巨大的結構性優勢。原因在於：

- **索引時間戳（Index Timestamp）**：Google Discover 和各 AI 系統的爬蟲會記錄首次發現某一事件的來源，首發媒體在早期的引用競爭中佔先。
- **引用的滾雪球效應**：後續媒體跟進報導時，若引用了第一手來源，相當於為其增加了大量的「入站實體提及」，進一步強化 AI 對該媒體的引用意願。
- **社群媒體首傳**：Twitter/X 的即時討論是 Perplexity 等系統的重要資料源，記者帳號在事發第一時間的推文，可以在正式報導上線前就建立「原始來源」的地位。

### 4.2 技術加速策略

**Sitemaps 即時更新**：突發事件文章應在發布後 1 分鐘內推送至 XML Sitemap，並透過 Google Search Console 的 Indexing API 主動請求索引，縮短 Googlebot 爬取時間差。

```xml
<!-- news sitemap 格式，適用於突發事件即時推送 -->
<url>
  <loc>https://example-news.com.tw/breaking/20250417-tsmc-earnings</loc>
  <news:news>
    <news:publication>
      <news:name>範例新聞</news:name>
      <news:language>zh-TW</news:language>
    </news:publication>
    <news:publication_date>2025-04-17T10:00:00+08:00</news:publication_date>
    <news:title>台積電 Q1 獲利創新高</news:title>
  </news:news>
</url>
```

**Indexing API 自動觸發**：可透過開源工具 **[goenning/google-indexing-script](https://github.com/goenning/google-indexing-script)** 批次提交新文章至 Google 索引，配合 CI/CD pipeline 在每次新文章發布時自動執行。

---

## 五、台灣主要媒體 AEO 觀察

以下觀察基於 2025 年 4 月對各媒體網站的抽樣技術審查與公開資訊，聚焦於結構化標記實作情況。

### 5.1 聯合新聞網（udn.com）

**優勢**：
- 長期參與 Google News Publisher Center，品牌知識圖譜建立相對完整
- 財經、科技報導有明確的記者署名頁面
- News Sitemap 更新頻率較高

**待改善**：
- `author` 標記普遍使用簡單字串，缺乏 `sameAs` 連結至跨平台身份
- `about` 實體標記不完整，主題分類多依賴舊式 `keywords` meta tag
- 部分深度報導缺少 FAQ 區塊

### 5.2 中國時報（chinatimes.com）

**優勢**：
- 部分頻道有實作 `NewsArticle` JSON-LD
- 集團資源豐富，報導涵蓋面廣

**待改善**：
- 結構化標記一致性不足，不同頻道標記品質差異大
- `publisher` 標記有時使用 `Organization` 而非 `NewsMediaOrganization`，損失語義精確度
- 記者個人品牌建設相對薄弱

### 5.3 自由時報（ltn.com.tw）

**優勢**：
- 即時新聞更新速度快，在突發事件的首發競爭上具優勢
- 網站效能（Core Web Vitals）表現較佳，有助於爬蟲效率

**待改善**：
- 結構化標記實作較為基本，缺乏 `citation` 和 `about` 的深度標記
- 沒有系統性的作者實體建設策略

### 5.4 蘋果新聞網（appledaily.com.tw）

**特殊情況**：蘋果日報台灣版於 2021 年停刊，目前以蘋果新聞網形式持續運營，但品牌影響力已大幅削弱。在 AI 引用競爭中，歷史品牌知名度雖仍存在於 LLM 訓練資料中，但即時引用能力已顯著下滑。

### 5.5 鏡週刊（mirrormedia.mg）

**優勢**：
- 開放架構，技術團隊較具備現代 Web 開發背景
- 深度調查報導內容品質高，適合作為 AI 的長尾專業引用來源
- 有實作部分 Open Graph 和基本 Schema 標記

**待改善**：
- 週刊出版週期不利於突發事件的 First-Mover 競爭
- `dateModified` 欄位更新不夠及時，可能影響 AI 的時效性判斷

### 5.6 台灣媒體 AEO 整體評估

台灣主要媒體在 AEO 上的共同弱點，在於**將 SEO 技術視為與 AEO 相同的工作**。實際上，AEO 要求更深層的語義標記、更強的作者實體識別，以及更主動的跨平台品牌建設。相較於 Reuters、AP 等國際媒體已全面部署 Wikidata 實體連結與深度 `sameAs` 標記，台灣媒體尚有明顯差距。

---

## 六、付費牆對 AI 引用的影響

### 6.1 付費牆的雙重困境

付費牆對媒體的 AI 引用能力構成**根本性的結構矛盾**：

**封閉換收入，但失去 AI 可見性**：  
若媒體在 `robots.txt` 封鎖 GPTBot、ClaudeBot、PerplexityBot 等 AI 爬蟲，理論上能保護付費內容不被免費摘用，但代價是在 AI 答案引擎中完全隱形。根據哥倫比亞大學 Tow 新聞中心 2025 年 3 月的研究，付費牆後的內容幾乎不會被 AI 引用，即使是內容品質極高的深度報導也無法例外。

**開放換引用，但面臨版權爭議**：  
開放 AI 爬蟲可提升被引用機率，但同時面臨「內容被 AI 無償摘用，讀者不必點進原文」的流量蒸發問題。《紐約時報》對 OpenAI 與微軟的訴訟，正是這一矛盾的極端體現。

### 6.2 付費牆類型與 AI 可見性的對應關係

| 付費牆類型 | AI 爬蟲可見度 | 引用機率 | 適合策略 |
|-----------|-------------|--------|---------|
| 硬付費牆（全封鎖） | 極低 | 幾乎為零 | 不建議（除非純訂閱模式） |
| 計量制付費牆（前 N 篇免費） | 中等 | 中等 | 需確保代表性文章在免費額度內 |
| 登入牆（免費但需帳號） | 低 | 低 | 考慮設定 AI 爬蟲白名單 |
| 免費全開 | 高 | 高 | 最大化 AEO 效益 |
| 混合型（突發免費、深度付費） | 中高 | 中高 | **推薦** |

### 6.3 `isAccessibleForFree` 的戰略運用

Schema.org 的 `isAccessibleForFree` 欄位，加上 `hasPart` 標記，可以精確告知 AI 爬蟲哪些部分可以自由閱讀：

```json
{
  "@type": "NewsArticle",
  "isAccessibleForFree": false,
  "hasPart": {
    "@type": "WebPageElement",
    "isAccessibleForFree": true,
    "cssSelector": ".article-summary, .article-lead"
  }
}
```

這讓 AI 能讀取摘要和導言段落，掌握報導的核心事實，並在引用時將媒體標示為來源，同時保護付費全文的商業價值。

### 6.4 robots.txt 策略建議

針對不同 AI 爬蟲的差異化策略，可以最大化商業利益與 AI 可見性的平衡：

```
# 允許 Perplexity（以即時引用換品牌曝光）
User-agent: PerplexityBot
Allow: /news/
Disallow: /premium/

# 允許 Google 用於 AI Overviews
User-agent: Googlebot
Allow: /

# 對 OpenAI 訓練爬蟲設限（但允許搜尋功能爬蟲）
User-agent: GPTBot
Disallow: /premium/
User-agent: ChatGPT-User
Allow: /
```

---

## 七、實作路線圖

根據本文分析，建議台灣新聞媒體依優先序執行以下 AEO 強化計畫：

### Phase 1（1-2 週）：基礎標記修正
- 全站 `NewsArticle` JSON-LD 稽核，修正缺漏欄位
- 確保所有文章的 `datePublished`/`dateModified` 使用完整 ISO 8601 格式含時區
- 將 `publisher` 從 `Organization` 升級為 `NewsMediaOrganization`

### Phase 2（1 個月）：作者實體建設
- 為所有記者建立標準化個人頁面，加入完整 `Person` schema
- 在 Wikidata 建立或完善記者詞條（可參考 **[wikidata-toolkit](https://github.com/Wikidata/Wikidata-Toolkit)** 批次工具）
- 推動記者在 Twitter/X、LinkedIn 使用一致的專業簡介

### Phase 3（2-3 個月）：內容結構優化
- 重要報導加入 `FAQPage` 區塊
- 突發事件建立自動推送 Indexing API 的工作流程
- 評估並實作差異化 robots.txt 策略

### Phase 4（持續）：監控與迭代
- 使用 **[LocalFalcon](https://www.localfalcon.com/)** 或自建監控系統，追蹤在 AI 答案引擎中的引用頻率
- 定期審查競爭媒體的引用表現，識別差距

---

## 結語

AI 搜尋時代的媒體競爭，本質上是**語義權威的競爭**。NewsArticle schema 是說服 AI 閱讀機器的語言；作者標記是在知識圖譜中建立信任錨點；突發事件的分秒必爭是時效性信任的來源；而付費牆策略的取捨，則決定了媒體在 AI 引用生態系中的能見度上限。

對台灣媒體而言，這是一個仍有機會彎道超車的視窗。國際媒體雖在品牌識別度上佔有先天優勢，但台灣本地語境、兩岸議題、本土財經事件的第一手報導，仍是在地 AI 引用生態中不可替代的事實來源。把握這個窗口，系統性部署 AEO 基礎建設，新聞媒體就能在 AI 重塑資訊秩序的過程中，繼續扮演社會事實的定錨角色。

---

## 參考資料

- Tow Center for Digital Journalism, Columbia University (2025). *AI search engines fail to produce accurate citations in over 60% of tests.* Nieman Lab.  
- arXiv:2507.05301 — *News Source Citing Patterns in AI Search Systems* (2025)  
- Google Developers. *NewsArticle structured data.* https://developers.google.com/search/docs/appearance/structured-data/news-article  
- Schema.org. *NewsArticle.* https://schema.org/NewsArticle  
- OpenAI. *GPTBot documentation.* https://platform.openai.com/docs/gptbot  
- GitHub: [JayHoltslander/Structured-Data-JSON-LD](https://github.com/JayHoltslander/Structured-Data-JSON-LD)  
- GitHub: [goenning/google-indexing-script](https://github.com/goenning/google-indexing-script)  
- GitHub: [Wikidata/Wikidata-Toolkit](https://github.com/Wikidata/Wikidata-Toolkit)  
- Digital Bloom (2025). *2025 AI Visibility Report: How LLMs Choose What Sources to Mention.*  
- Metaflow (2025). *AI Search Ranking Factors: What Actually Influences ChatGPT, Perplexity and Google AI.*