當相關被說成因果：從一則愛滋新聞「賴清德：現在愛滋病的主因不是針頭，而是男男同性戀」談 AI 幻覺

從一則引發爭議的愛滋新聞「賴清德：現在愛滋病的主因不是針頭，而是男男同性戀」出發，拆解統計相關、因果推論與標籤化之間的落差，並說明生成式 AI 為何會產生看似合理、實際上卻站不住腳的答案。

投稿日 2026/06/22

投稿者

11 分で読めます

前言

2017 年 9 月，「賴清德：現在愛滋病的主因不是針頭，而是男男同性戀」這則新聞引起不少討論。報導中出現了這樣的說法：現在感染愛滋病毒的主要原因，不再是共用針具，而是男性間的性行為。

這句話讀起來很順，甚至像是一個有統計資料支持的結論；但仔細拆開後，會發現它把不同層次的概念混在了一起。問題不只出在新聞寫法，也很像今天生成式 AI 常見的幻覺：從幾個彼此相關的資訊，拼出一段語意流暢、卻未必成立的因果關係。

本文並不是要重新審判個案，而是想借這個例子討論兩件事：我們如何讀懂統計資料，以及 AI 為什麼會一本正經地說錯話。

問題不在數字，而在數字被怎麼解釋

統計變項不等於原因

統計資料常把個案依年齡、性別、行為或其他特徵分類。這些變項可以幫助我們觀察現象，卻不能單獨證明因果。

例如，資料中可能同時記錄：

性傾向或自我認同
是否曾與同性發生性行為
是否共用針具
是否採取安全性行為
接觸與感染的途徑

這些欄位彼此有關，卻不是同一件事。性傾向是身分或情感傾向，性行為是行為，而感染途徑則涉及病毒如何傳播。若直接把「某個族群中病例較多」改寫成「某種身分造成疾病」，就已經跨過了資料能支持的範圍。

高比例不代表高風險，更不代表因果

假設病例資料顯示，某個群體在已知感染者中的占比較高，至少還要追問：

分母是什麼？是全體人口、接受篩檢者，還是已確診者？
資料記錄的是身分、行為，還是實際感染途徑？
不同群體接受篩檢的比例是否相同？
是否存在其他共同因素，例如防護方式、醫療可近性或通報差異？
資料呈現的是相關性，還是有足夠證據支持因果關係？

只看比例，很容易得到一個過度簡化的故事；而一旦故事符合既有印象，人們往往就不再追問。

公共衛生應該談行為與防護，不是替身分貼標籤

病毒不會辨認一個人的性傾向、職業或社會身分。真正與傳播風險直接相關的，是具體接觸方式、是否採取有效防護，以及能否取得篩檢與醫療資源。

把健康風險綁在身分上，不只是不精確，也可能讓不屬於特定標籤的人誤以為自己沒有風險；另一方面，被標籤的群體也可能因害怕歧視而迴避篩檢。這樣的敘事不但沒有幫助理解問題，反而可能妨礙防治。

同樣的錯誤也常見於其他議題。例如看到某款軟體的使用者與某種職業高度重疊，不能反過來斷言該職業中的每個人都使用那款軟體，更不能說軟體「造成」了那個職業。群體、行為、結果與原因，不能因為經常一起出現就被畫上等號。

這和 AI 幻覺有什麼關係？

生成式 AI 擅長的，是根據上下文預測接下來最可能出現的文字。它能寫出流暢的句子，卻不代表它已經驗證句子中的事實與推論。

當模型讀過大量新聞、評論與網路文章後，很容易學到一些經常共同出現的詞語。若缺少明確限制，它可能把「經常一起出現」壓縮成「兩者相等」，甚至進一步補上一條不存在的因果鏈。

1. 把相關性補成因果關係

模型看到 A 經常與 B 一起出現，便可能產生「A 導致 B」的句子。語法完全正確，邏輯卻多走了一步。

這也是人類閱讀統計新聞時最容易犯的錯：資料只說兩個現象同時出現，我們的大腦卻急著替它們安排原因與結果。

2. 把不同層次的概念混為一談

「男性間性行為」描述的是行為，「男同志」通常指身分或性傾向；「使用某種工具」是行為，「從事某個職業」則是職業分類。這些概念可能重疊，但不能互換。

語言模型主要從文字共現關係學習。如果訓練資料經常混用這些詞，模型也可能延續同樣的混淆。

3. 用刻板印象填補缺少的資訊

當資料不足時，模型仍傾向產生一個完整答案。最容易被拿來補洞的，往往是網路上反覆出現的典型敘事與刻板印象。

因此，幻覺不一定是一個憑空捏造的名字或日期。它也可能是更隱蔽的錯誤：每句話個別看似合理，串起來卻把特例說成通則、把群體特徵套在個人身上，或把相關性包裝成因果關係。

4. 流暢會製造「它一定知道」的錯覺

生成式 AI 最危險的地方，不是它會出錯，而是它出錯時仍然很流暢。人們容易把語氣肯定、結構完整與內容可靠混為一談。

但文字的流暢度，只代表模型很會組織語言；它不能代替證據。

怎麼降低被 AI 幻覺誤導的機會？

面對 AI 的答案，可以先做幾個簡單檢查：

拆開主張：這段話包含哪些可以分別查證的事實？
檢查概念：文中的身分、行為、群體與結果是否被混用？
追問分母：看到比例時，樣本是誰？比較基準又是什麼？
區分相關與因果：資料真的證明 A 導致 B，還是兩者只是同時出現？
尋找反例：是否存在 A 但沒有 B，或有 B 卻沒有 A 的情況？
回到原始來源：重要資訊應查閱研究、判決、政府資料或其他第一手內容，而不是只相信摘要。

也可以直接要求 AI 說明它的依據、列出不確定之處，並提出可能的反例。不過，AI 提供的來源本身仍需要確認；「附上引用」不等於「已經查證」。

結語

AI 幻覺不是全新的問題。人類早就會選擇性解讀統計、混淆概念，並用刻板印象補齊不知道的部分。生成式 AI 只是把這些語言習慣學了起來，再用更快、更完整，也更有自信的方式呈現。

因此，真正需要培養的能力，不只是辨認 AI 有沒有說錯某個數字，而是看見推論中那個偷偷多出來的等號：

A 與 B 經常一起出現，不代表 A 就是 B，更不代表 A 造成 B。

無論面對新聞、統計資料或 AI 生成的答案，只要願意多問一句「這個結論是怎麼來的？」，就能避開許多看似自然、其實並不成立的推論。

參考資料

AI Critical Thinking

この投稿は投稿者によって CC BY 4.0 の下でライセンスされています。