AEO for 新聞媒體 — 新聞網站被 AI 引用的策略

由 CiphLens 團隊整理 · 來源：GitHub Copilot 研究 · 繁體中文

● Web Search (MCP: github-mcp-server) · NewsArticle schema markup AI citation SEO AEO structured da… └ {"type":"output_text","text":{"value":"Certainly! For news websites ...

● Web Search (MCP: github-mcp-server) · paywall news AI crawling citation GPTBot ClaudeBot robots.t… └ {"type":"output_text","text":{"value":"It looks like you’re asking about...

● Web Search (MCP: github-mcp-server) · AI citation ranking factors perplexity ChatGPT search news … └ {"type":"output_text","text":{"value":"Recent research from 2024 and 202...

新聞媒體如何成為 AI 搜尋的事實來源：AEO 完全指南

前言：從 SEO 到 AEO 的典範轉移

過去十年，新聞媒體的數位競爭場域是搜尋引擎最佳化（SEO）。然而自 2023 年起，隨著 ChatGPT、Perplexity、Google AI Overviews、Microsoft Copilot 等 AI 答案引擎席捲日常資訊消費，一個新的競爭維度已悄然成形：答案引擎最佳化（Answer Engine Optimization，AEO）。

對新聞媒體而言，這場典範轉移的賭注遠比一般網站更高。當讀者詢問「台灣今年 GDP 成長率是多少？」或「鴻海最新的財報結果如何？」，AI 所引用的來源，便是在數億用戶面前被認可的「事實權威」。被引用，等同於被信任；不被引用，等同於在 AI 原生世代的讀者面前隱形。

本文從結構化標記、作者權威、引用加分機制、突發事件策略，到台灣主要媒體的現況觀察，以及付費牆對 AI 可見性的影響，提供一套系統性的理解框架與實作指引。

一、NewsArticle Schema：AI 閱讀新聞的語言

1.1 為何結構化資料對 AI 至關重要

AI 搜尋引擎的底層架構多採用檢索增強生成（Retrieval-Augmented Generation，RAG）。RAG 系統在生成答案前，會先從外部知識庫或即時爬取的網頁中抽取相關段落，再交由語言模型合成。這個過程中，結構化的 HTML 標記大幅降低了解析成本，讓 AI 能精確識別：誰寫的、何時發布、內容主題為何、原始出處在哪裡。

Schema.org 定義的 NewsArticle 類型，正是為此設計。根據 Google 官方文件，NewsArticle 是 Article 的子類型，針對新聞報導加入了特定欄位，包含 dateline（電報日期行）與新聞相關語義標籤。

1.2 完整 NewsArticle JSON-LD 實作範例

以下是一個符合 2025 年最佳實踐的完整標記範例，涵蓋 AI 引用所需的所有核心欄位：

{
  "@context": "https://schema.org",
  "@type": "NewsArticle",
  "headline": "台積電第一季淨利創歷史新高，達新台幣 3,615 億元",
  "alternativeHeadline": "TSMC Q1 2025 獲利突破預期，AI 晶片需求強勁",
  "datePublished": "2025-04-17T10:00:00+08:00",
  "dateModified": "2025-04-17T14:30:00+08:00",
  "author": [
    {
      "@type": "Person",
      "name": "林志遠",
      "url": "https://example-news.com.tw/reporter/lin-chih-yuan",
      "sameAs": [
        "https://twitter.com/linchihyuan",
        "https://www.linkedin.com/in/linchihyuan"
      ]
    }
  ],
  "publisher": {
    "@type": "NewsMediaOrganization",
    "name": "範例新聞",
    "url": "https://example-news.com.tw",
    "logo": {
      "@type": "ImageObject",
      "url": "https://example-news.com.tw/logo.png",
      "width": 600,
      "height": 60
    },
    "masthead": "https://example-news.com.tw/about"
  },
  "description": "台積電公布 2025 年第一季財報，淨利達新台幣 3,615 億元，年增 60.3%，超越市場預期，主要受惠於 AI 相關晶片強勁需求。",
  "articleBody": "台積電（TSMC）今日公布...",
  "image": {
    "@type": "ImageObject",
    "url": "https://example-news.com.tw/images/tsmc-q1-2025.jpg",
    "width": 1200,
    "height": 630
  },
  "mainEntityOfPage": {
    "@type": "WebPage",
    "@id": "https://example-news.com.tw/finance/tsmc-q1-2025"
  },
  "isAccessibleForFree": true,
  "isPartOf": {
    "@type": "CreativeWork",
    "name": "財經新聞"
  },
  "about": [
    { "@type": "Organization", "name": "台積電", "sameAs": "https://www.wikidata.org/wiki/Q732022" },
    { "@type": "Thing", "name": "半導體" }
  ],
  "citation": [
    {
      "@type": "CreativeWork",
      "name": "台積電 2025 年第一季法說會簡報",
      "url": "https://investor.tsmc.com"
    }
  ],
  "dateline": "新竹，台灣",
  "inLanguage": "zh-TW"
}

1.3 關鍵欄位解析

| 欄位 | AI 引用重要性 | 說明 | |------|-------------|------| | datePublished / dateModified | ★★★★★ | 時效性判斷的核心依據 | | author (含 sameAs) | ★★★★★ | 連結至 Wikidata/社群媒體強化作者實體識別 | | publisher 使用 NewsMediaOrganization | ★★★★☆ | 比一般 Organization 更精確標識媒體性質 | | isAccessibleForFree | ★★★★☆ | 直接影響 AI 是否能讀取全文 | | about (含 sameAs 指向 Wikidata) | ★★★★☆ | 幫助 AI 建立主題知識圖譜連結 | | citation | ★★★☆☆ | 標示報導引用的原始資料來源 |

開源工具方面，可參考 google/structured-data-testing-tool（已封存，但邏輯仍具參考價值）及社群維護的替代品 nicholasess/structured-data-testing-tool，可在本機驗證標記是否符合 Schema.org 規範。另外，JayHoltslander/Structured-Data-JSON-LD 提供大量現成模板，適合快速套用。

二、Author 標記：建立記者的 AI 可識別身份

2.1 E-E-A-T 與作者實體的關係

Google 的品質評估框架 E-E-A-T（Experience、Expertise、Authoritativeness、Trustworthiness）不只適用於 Google 搜尋，也逐漸成為 AI 判斷來源可信度的隱性標準。作者的 AI 可識別性（Entity Salience）越高，所撰寫的報導被引用的機率越大。

2.2 記者實體建立的四個層次

第一層：Schema 標記中的 sameAs 將作者的 Schema 標記連結至 Wikidata、LinkedIn、Twitter/X 等可跨域驗證的身份，讓 AI 能確認「林志遠 in 聯合報」與「Lin Chih-yuan at UDN」是同一個實體。

第二層：Google 搜尋知識面板（Knowledge Panel） 若記者有足夠的網路存在感（知名專欄、出版品、演講等），Google 會自動建立知識面板。這意味著該記者已進入 Google 知識圖譜，被 AI 視為已驗證的真實實體。

第三層：作者個人頁面的結構化資料 每位記者應有獨立的 Person 頁面，標記其：

jobTitle：記者、主編、駐台北特派員
knowsAbout：財經、半導體、兩岸關係（以 schema.org 的主題實體表示）
worksFor：所屬媒體機構
hasCredential：學術背景或專業認證

第四層：跨平台一致性 AI 的信任判斷源於「多來源交叉驗證」。同一記者在 LinkedIn、Twitter、媒體官網的姓名、頭銜、專業描述必須一致，才能讓 AI 建立穩固的實體連結。

三、Citation 加分機制：如何讓 AI 選擇你

3.1 AI 引用決策的底層邏輯

根據 2025 年學術論文 "News Source Citing Patterns in AI Search Systems"（arXiv:2507.05301），AI 搜尋系統在選擇引用來源時，主要考量以下因素：

品牌識別度（Brand Recognition）：即使沒有反向連結，媒體品牌在訓練資料中出現的頻率決定了其「知名度分數」。這解釋了為何 BBC、Reuters、AP 在 ChatGPT 引用中佔據高度優勢。

內容可抽取性（Extractability）：AI 偏好能直接找到「答案塊」的文章。研究發現，在文章開頭 100 字內直接回答核心問題，可使引用率顯著提升。

跨平台提及（Cross-Platform Mentions）：同一報導被 4 個以上來源引用或討論，可大幅提升 AI 的信任度。這創造了「第一個報導者的滾雪球效應」。

時效性（Freshness）：Perplexity 等即時搜尋 AI 對新鮮度極度敏感。發布後數分鐘內的索引速度，決定了突發事件的引用競爭結果。

3.2 結構性寫作策略：為 AI 而寫

倒金字塔 2.0：傳統新聞倒金字塔結構本就契合 AI 需求，但需強化「答案前置」的設計：

## 台積電 Q1 獲利創新高

**核心事實**（AI 摘要段落）：台積電 2025 年第一季淨利達 3,615 億元新台幣，
年增 60.3%，每股盈餘 13.94 元，優於市場預期的 13.5 元。

**背景**：...（以下正文）

FAQ 區塊：在文末加入 FAQPage schema 的 Q&A 區塊。研究顯示，FAQ 標記可使 AI 引用率提升達 3 倍，因為 AI 的 RAG 系統特別善於提取問答對格式的知識。

數據表格：數字型資訊應優先以 HTML <table> 呈現，搭配清晰的表頭，而非埋在長段落中。AI 解析表格的效率遠高於敘述性文字。

四、突發事件的 First-Mover 優勢

4.1 時間窗口的決定性作用

在突發事件報導中，「第一個發布可信來源」的媒體享有巨大的結構性優勢。原因在於：

索引時間戳（Index Timestamp）：Google Discover 和各 AI 系統的爬蟲會記錄首次發現某一事件的來源，首發媒體在早期的引用競爭中佔先。
引用的滾雪球效應：後續媒體跟進報導時，若引用了第一手來源，相當於為其增加了大量的「入站實體提及」，進一步強化 AI 對該媒體的引用意願。
社群媒體首傳：Twitter/X 的即時討論是 Perplexity 等系統的重要資料源，記者帳號在事發第一時間的推文，可以在正式報導上線前就建立「原始來源」的地位。

4.2 技術加速策略

Sitemaps 即時更新：突發事件文章應在發布後 1 分鐘內推送至 XML Sitemap，並透過 Google Search Console 的 Indexing API 主動請求索引，縮短 Googlebot 爬取時間差。

<!-- news sitemap 格式，適用於突發事件即時推送 -->
<url>
  <loc>https://example-news.com.tw/breaking/20250417-tsmc-earnings</loc>
  <news:news>
    <news:publication>
      <news:name>範例新聞</news:name>
      <news:language>zh-TW</news:language>
    </news:publication>
    <news:publication_date>2025-04-17T10:00:00+08:00</news:publication_date>
    <news:title>台積電 Q1 獲利創新高</news:title>
  </news:news>
</url>

Indexing API 自動觸發：可透過開源工具 goenning/google-indexing-script 批次提交新文章至 Google 索引，配合 CI/CD pipeline 在每次新文章發布時自動執行。

五、台灣主要媒體 AEO 觀察

以下觀察基於 2025 年 4 月對各媒體網站的抽樣技術審查與公開資訊，聚焦於結構化標記實作情況。

5.1 聯合新聞網（udn.com）

優勢：

長期參與 Google News Publisher Center，品牌知識圖譜建立相對完整
財經、科技報導有明確的記者署名頁面
News Sitemap 更新頻率較高

待改善：

author 標記普遍使用簡單字串，缺乏 sameAs 連結至跨平台身份
about 實體標記不完整，主題分類多依賴舊式 keywords meta tag
部分深度報導缺少 FAQ 區塊

5.2 中國時報（chinatimes.com）

優勢：

部分頻道有實作 NewsArticle JSON-LD
集團資源豐富，報導涵蓋面廣

待改善：

結構化標記一致性不足，不同頻道標記品質差異大
publisher 標記有時使用 Organization 而非 NewsMediaOrganization，損失語義精確度
記者個人品牌建設相對薄弱

5.3 自由時報（ltn.com.tw）

優勢：

即時新聞更新速度快，在突發事件的首發競爭上具優勢
網站效能（Core Web Vitals）表現較佳，有助於爬蟲效率

待改善：

結構化標記實作較為基本，缺乏 citation 和 about 的深度標記
沒有系統性的作者實體建設策略

5.4 蘋果新聞網（appledaily.com.tw）

特殊情況：蘋果日報台灣版於 2021 年停刊，目前以蘋果新聞網形式持續運營，但品牌影響力已大幅削弱。在 AI 引用競爭中，歷史品牌知名度雖仍存在於 LLM 訓練資料中，但即時引用能力已顯著下滑。

5.5 鏡週刊（mirrormedia.mg）

優勢：

開放架構，技術團隊較具備現代 Web 開發背景
深度調查報導內容品質高，適合作為 AI 的長尾專業引用來源
有實作部分 Open Graph 和基本 Schema 標記

待改善：

週刊出版週期不利於突發事件的 First-Mover 競爭
dateModified 欄位更新不夠及時，可能影響 AI 的時效性判斷

5.6 台灣媒體 AEO 整體評估

台灣主要媒體在 AEO 上的共同弱點，在於將 SEO 技術視為與 AEO 相同的工作。實際上，AEO 要求更深層的語義標記、更強的作者實體識別，以及更主動的跨平台品牌建設。相較於 Reuters、AP 等國際媒體已全面部署 Wikidata 實體連結與深度 sameAs 標記，台灣媒體尚有明顯差距。

六、付費牆對 AI 引用的影響

6.1 付費牆的雙重困境

付費牆對媒體的 AI 引用能力構成根本性的結構矛盾：

封閉換收入，但失去 AI 可見性：若媒體在 robots.txt 封鎖 GPTBot、ClaudeBot、PerplexityBot 等 AI 爬蟲，理論上能保護付費內容不被免費摘用，但代價是在 AI 答案引擎中完全隱形。根據哥倫比亞大學 Tow 新聞中心 2025 年 3 月的研究，付費牆後的內容幾乎不會被 AI 引用，即使是內容品質極高的深度報導也無法例外。

開放換引用，但面臨版權爭議：開放 AI 爬蟲可提升被引用機率，但同時面臨「內容被 AI 無償摘用，讀者不必點進原文」的流量蒸發問題。《紐約時報》對 OpenAI 與微軟的訴訟，正是這一矛盾的極端體現。

6.2 付費牆類型與 AI 可見性的對應關係

| 付費牆類型 | AI 爬蟲可見度 | 引用機率 | 適合策略 | |-----------|-------------|--------|---------| | 硬付費牆（全封鎖） | 極低 | 幾乎為零 | 不建議（除非純訂閱模式） | | 計量制付費牆（前 N 篇免費） | 中等 | 中等 | 需確保代表性文章在免費額度內 | | 登入牆（免費但需帳號） | 低 | 低 | 考慮設定 AI 爬蟲白名單 | | 免費全開 | 高 | 高 | 最大化 AEO 效益 | | 混合型（突發免費、深度付費） | 中高 | 中高 | 推薦 |

6.3 `isAccessibleForFree` 的戰略運用

Schema.org 的 isAccessibleForFree 欄位，加上 hasPart 標記，可以精確告知 AI 爬蟲哪些部分可以自由閱讀：

{
  "@type": "NewsArticle",
  "isAccessibleForFree": false,
  "hasPart": {
    "@type": "WebPageElement",
    "isAccessibleForFree": true,
    "cssSelector": ".article-summary, .article-lead"
  }
}

這讓 AI 能讀取摘要和導言段落，掌握報導的核心事實，並在引用時將媒體標示為來源，同時保護付費全文的商業價值。

6.4 robots.txt 策略建議

針對不同 AI 爬蟲的差異化策略，可以最大化商業利益與 AI 可見性的平衡：

# 允許 Perplexity（以即時引用換品牌曝光）
User-agent: PerplexityBot
Allow: /news/
Disallow: /premium/

# 允許 Google 用於 AI Overviews
User-agent: Googlebot
Allow: /

# 對 OpenAI 訓練爬蟲設限（但允許搜尋功能爬蟲）
User-agent: GPTBot
Disallow: /premium/
User-agent: ChatGPT-User
Allow: /

七、實作路線圖

根據本文分析，建議台灣新聞媒體依優先序執行以下 AEO 強化計畫：

Phase 1（1-2 週）：基礎標記修正

全站 NewsArticle JSON-LD 稽核，修正缺漏欄位
確保所有文章的 datePublished/dateModified 使用完整 ISO 8601 格式含時區
將 publisher 從 Organization 升級為 NewsMediaOrganization

Phase 2（1 個月）：作者實體建設

為所有記者建立標準化個人頁面，加入完整 Person schema
在 Wikidata 建立或完善記者詞條（可參考 wikidata-toolkit 批次工具）
推動記者在 Twitter/X、LinkedIn 使用一致的專業簡介

Phase 3（2-3 個月）：內容結構優化

重要報導加入 FAQPage 區塊
突發事件建立自動推送 Indexing API 的工作流程
評估並實作差異化 robots.txt 策略

Phase 4（持續）：監控與迭代

使用 LocalFalcon 或自建監控系統，追蹤在 AI 答案引擎中的引用頻率
定期審查競爭媒體的引用表現，識別差距

結語

AI 搜尋時代的媒體競爭，本質上是語義權威的競爭。NewsArticle schema 是說服 AI 閱讀機器的語言；作者標記是在知識圖譜中建立信任錨點；突發事件的分秒必爭是時效性信任的來源；而付費牆策略的取捨，則決定了媒體在 AI 引用生態系中的能見度上限。

對台灣媒體而言，這是一個仍有機會彎道超車的視窗。國際媒體雖在品牌識別度上佔有先天優勢，但台灣本地語境、兩岸議題、本土財經事件的第一手報導，仍是在地 AI 引用生態中不可替代的事實來源。把握這個窗口，系統性部署 AEO 基礎建設，新聞媒體就能在 AI 重塑資訊秩序的過程中，繼續扮演社會事實的定錨角色。

參考資料

Tow Center for Digital Journalism, Columbia University (2025). AI search engines fail to produce accurate citations in over 60% of tests. Nieman Lab.
arXiv:2507.05301 — News Source Citing Patterns in AI Search Systems (2025)
Google Developers. NewsArticle structured data. https://developers.google.com/search/docs/appearance/structured-data/news-article
Schema.org. NewsArticle. https://schema.org/NewsArticle
OpenAI. GPTBot documentation. https://platform.openai.com/docs/gptbot
GitHub: JayHoltslander/Structured-Data-JSON-LD
GitHub: goenning/google-indexing-script
GitHub: Wikidata/Wikidata-Toolkit
Digital Bloom (2025). 2025 AI Visibility Report: How LLMs Choose What Sources to Mention.
Metaflow (2025). AI Search Ranking Factors: What Actually Influences ChatGPT, Perplexity and Google AI.

AEO for 新聞媒體 — 新聞網站被 AI 引用的策略

新聞媒體如何成為 AI 搜尋的事實來源：AEO 完全指南

前言：從 SEO 到 AEO 的典範轉移

一、NewsArticle Schema：AI 閱讀新聞的語言

1.1 為何結構化資料對 AI 至關重要

1.2 完整 NewsArticle JSON-LD 實作範例

1.3 關鍵欄位解析

二、Author 標記：建立記者的 AI 可識別身份

2.1 E-E-A-T 與作者實體的關係

2.2 記者實體建立的四個層次

三、Citation 加分機制：如何讓 AI 選擇你

3.1 AI 引用決策的底層邏輯

3.2 結構性寫作策略：為 AI 而寫

四、突發事件的 First-Mover 優勢

4.1 時間窗口的決定性作用

4.2 技術加速策略

五、台灣主要媒體 AEO 觀察

5.1 聯合新聞網（udn.com）

5.2 中國時報（chinatimes.com）

5.3 自由時報（ltn.com.tw）

5.4 蘋果新聞網（appledaily.com.tw）

5.5 鏡週刊（mirrormedia.mg）

5.6 台灣媒體 AEO 整體評估

六、付費牆對 AI 引用的影響

6.1 付費牆的雙重困境

6.2 付費牆類型與 AI 可見性的對應關係

6.3 isAccessibleForFree 的戰略運用

6.4 robots.txt 策略建議

七、實作路線圖

Phase 1（1-2 週）：基礎標記修正

Phase 2（1 個月）：作者實體建設

Phase 3（2-3 個月）：內容結構優化

Phase 4（持續）：監控與迭代

結語

參考資料

6.3 `isAccessibleForFree` 的戰略運用