投稿

當相關被說成因果:從一則愛滋新聞「賴清德:現在愛滋病的主因不是針頭,而是男男同性戀」談 AI 幻覺

從一則引發爭議的愛滋新聞「賴清德:現在愛滋病的主因不是針頭,而是男男同性戀」出發,拆解統計相關、因果推論與標籤化之間的落差,並說明生成式 AI 為何會產生看似合理、實際上卻站不住腳的答案。

當相關被說成因果:從一則愛滋新聞「賴清德:現在愛滋病的主因不是針頭,而是男男同性戀」談 AI 幻覺

前言

2017 年 9 月,「賴清德:現在愛滋病的主因不是針頭,而是男男同性戀」這則新聞引起不少討論。報導中出現了這樣的說法:現在感染愛滋病毒的主要原因,不再是共用針具,而是男性間的性行為。

這句話讀起來很順,甚至像是一個有統計資料支持的結論;但仔細拆開後,會發現它把不同層次的概念混在了一起。問題不只出在新聞寫法,也很像今天生成式 AI 常見的幻覺:從幾個彼此相關的資訊,拼出一段語意流暢、卻未必成立的因果關係。

本文並不是要重新審判個案,而是想借這個例子討論兩件事:我們如何讀懂統計資料,以及 AI 為什麼會一本正經地說錯話。

問題不在數字,而在數字被怎麼解釋

統計變項不等於原因

統計資料常把個案依年齡、性別、行為或其他特徵分類。這些變項可以幫助我們觀察現象,卻不能單獨證明因果。

例如,資料中可能同時記錄:

  • 性傾向或自我認同
  • 是否曾與同性發生性行為
  • 是否共用針具
  • 是否採取安全性行為
  • 接觸與感染的途徑

這些欄位彼此有關,卻不是同一件事。性傾向是身分或情感傾向,性行為是行為,而感染途徑則涉及病毒如何傳播。若直接把「某個族群中病例較多」改寫成「某種身分造成疾病」,就已經跨過了資料能支持的範圍。

高比例不代表高風險,更不代表因果

假設病例資料顯示,某個群體在已知感染者中的占比較高,至少還要追問:

  1. 分母是什麼?是全體人口、接受篩檢者,還是已確診者?
  2. 資料記錄的是身分、行為,還是實際感染途徑?
  3. 不同群體接受篩檢的比例是否相同?
  4. 是否存在其他共同因素,例如防護方式、醫療可近性或通報差異?
  5. 資料呈現的是相關性,還是有足夠證據支持因果關係?

只看比例,很容易得到一個過度簡化的故事;而一旦故事符合既有印象,人們往往就不再追問。

公共衛生應該談行為與防護,不是替身分貼標籤

病毒不會辨認一個人的性傾向、職業或社會身分。真正與傳播風險直接相關的,是具體接觸方式、是否採取有效防護,以及能否取得篩檢與醫療資源。

把健康風險綁在身分上,不只是不精確,也可能讓不屬於特定標籤的人誤以為自己沒有風險;另一方面,被標籤的群體也可能因害怕歧視而迴避篩檢。這樣的敘事不但沒有幫助理解問題,反而可能妨礙防治。

同樣的錯誤也常見於其他議題。例如看到某款軟體的使用者與某種職業高度重疊,不能反過來斷言該職業中的每個人都使用那款軟體,更不能說軟體「造成」了那個職業。群體、行為、結果與原因,不能因為經常一起出現就被畫上等號。

這和 AI 幻覺有什麼關係?

生成式 AI 擅長的,是根據上下文預測接下來最可能出現的文字。它能寫出流暢的句子,卻不代表它已經驗證句子中的事實與推論。

當模型讀過大量新聞、評論與網路文章後,很容易學到一些經常共同出現的詞語。若缺少明確限制,它可能把「經常一起出現」壓縮成「兩者相等」,甚至進一步補上一條不存在的因果鏈。

1. 把相關性補成因果關係

模型看到 A 經常與 B 一起出現,便可能產生「A 導致 B」的句子。語法完全正確,邏輯卻多走了一步。

這也是人類閱讀統計新聞時最容易犯的錯:資料只說兩個現象同時出現,我們的大腦卻急著替它們安排原因與結果。

2. 把不同層次的概念混為一談

「男性間性行為」描述的是行為,「男同志」通常指身分或性傾向;「使用某種工具」是行為,「從事某個職業」則是職業分類。這些概念可能重疊,但不能互換。

語言模型主要從文字共現關係學習。如果訓練資料經常混用這些詞,模型也可能延續同樣的混淆。

3. 用刻板印象填補缺少的資訊

當資料不足時,模型仍傾向產生一個完整答案。最容易被拿來補洞的,往往是網路上反覆出現的典型敘事與刻板印象。

因此,幻覺不一定是一個憑空捏造的名字或日期。它也可能是更隱蔽的錯誤:每句話個別看似合理,串起來卻把特例說成通則、把群體特徵套在個人身上,或把相關性包裝成因果關係。

4. 流暢會製造「它一定知道」的錯覺

生成式 AI 最危險的地方,不是它會出錯,而是它出錯時仍然很流暢。人們容易把語氣肯定、結構完整與內容可靠混為一談。

但文字的流暢度,只代表模型很會組織語言;它不能代替證據。

怎麼降低被 AI 幻覺誤導的機會?

面對 AI 的答案,可以先做幾個簡單檢查:

  1. 拆開主張:這段話包含哪些可以分別查證的事實?
  2. 檢查概念:文中的身分、行為、群體與結果是否被混用?
  3. 追問分母:看到比例時,樣本是誰?比較基準又是什麼?
  4. 區分相關與因果:資料真的證明 A 導致 B,還是兩者只是同時出現?
  5. 尋找反例:是否存在 A 但沒有 B,或有 B 卻沒有 A 的情況?
  6. 回到原始來源:重要資訊應查閱研究、判決、政府資料或其他第一手內容,而不是只相信摘要。

也可以直接要求 AI 說明它的依據、列出不確定之處,並提出可能的反例。不過,AI 提供的來源本身仍需要確認;「附上引用」不等於「已經查證」。

結語

AI 幻覺不是全新的問題。人類早就會選擇性解讀統計、混淆概念,並用刻板印象補齊不知道的部分。生成式 AI 只是把這些語言習慣學了起來,再用更快、更完整,也更有自信的方式呈現。

因此,真正需要培養的能力,不只是辨認 AI 有沒有說錯某個數字,而是看見推論中那個偷偷多出來的等號:

A 與 B 經常一起出現,不代表 A 就是 B,更不代表 A 造成 B。

無論面對新聞、統計資料或 AI 生成的答案,只要願意多問一句「這個結論是怎麼來的?」,就能避開許多看似自然、其實並不成立的推論。

參考資料

この投稿は投稿者によって CC BY 4.0 の下でライセンスされています。

トレンドのタグ