研究發現AI新聞錯誤率近半　Gemini最嚴重

章倩萍／ 2025年10月22日

【生活中心／綜合報導】歐洲廣播聯盟（European Broadcasting Union, EBU）今天（22日）公布一項大規模研究顯示，ChatGPT之類的人工智慧（AI）助理，回答有關新聞事件的問題時，存在普遍且系統性的問題，無論使用何種語言、地區或 AI 平台，45% 的 AI 回答至少包含一個重大問題，嚴重地誤傳新聞內容。

這項研究涵蓋了來自18個國家、使用14種語言的22家公共服務媒體機構，評估OpenAI的ChatGPT、微軟（Microsoft）的Copilot、谷歌（Google）的Gemini 和Perplexity等四大AI平台的3千多個回應。

報告說，整體而言，45%的AI答覆「至少有一項重大問題」，而且不分語言或來源國家。每5則答覆中就有1則「存在嚴重的正確性問題，包括虛構細節與過時資訊。」

研究報告指出，4款AI助理之中，「Gemini的表現最差，76%的回應中，出現重大問題，比例是其他助理的兩倍以上，主要和資訊來源表現不佳有關。」

這項研究在今年5月底至6月初進行，透過全球22加公共媒體機構、14個與腫的專業記者，分別根據準確性、來源引用、區分事實與意見、提供背景資訊等標準評估AI助理的回覆，發現以下主要問題：整體發現45%的AI回覆至少有一個重大問題；31%的回答存在嚴重的遺漏、誤導或不正確的消息來源歸屬問題；20%的回答包含重大準確性問題，包括捏造的細節（幻覺）和過時的資訊。

例如，問到「教宗是誰」時，ChatGPT告訴芬蘭國家廣播公司是「方濟各」（Francis）；Copilot和Gemini給荷蘭廣播基金會（NOS）和荷蘭公共廣播（NPO）的答案也是「方濟各」，但當時他已過世，由良十四世（Leo XIV）接任。

法國廣播電台（Radio France）詢問關於馬斯克（Elon Musk）在1月美國總統川普就職典禮上疑似行納粹禮的傳聞時，Gemini回答說這位億萬富豪「右臂勃起」，顯然是把一位喜劇演員的諷刺專欄，當作事實內容。

歐洲廣播聯盟副秘書長坦德（Jean Philip De Tender）與英國廣播公司（BBC）AI主管阿契爾（Pete Archer）表示：「AI助理仍不是獲取和瀏覽新聞的可靠方式。」即便有這些缺陷，AI助理在獲取資訊方面的使用率仍持續增加，尤其受到年輕人青睞。

EBU 媒體總監Jean Philip De Tender指出，這項研究「確定性地顯示，這些失誤不是孤立事件，而是系統性、跨國界和多語言的，」，並且「危及公眾信任。」而AI 助理正取代許多用戶的搜尋引擎，7%的網路新聞消費者使用AI獲取新聞，在25歲以下群體中，這一比例更高達15%。

研究團隊為了解決這些問題，發布《AI 助理中的新聞誠信工具包（News Integrity in AI Assistants Toolkit）》，希望幫助開發解決方案，該工具包探討「一個好的 AI 助理新聞回答應具備什麼？」及「需要修復哪些問題？」。

另外，EBU及其成員，正敦促歐盟和各國監管機構執行現有法律，內容涵蓋資訊誠信、數位服務和媒體多元化。有鑒於AI發展快速，他們強調持續進行獨立監測至關重要，正尋求資源持續進行這項研究。

英國廣播公司（BBC）節目總監Peter Archer表示，他們對AI感到興奮，但用戶必須能夠信任他們所讀、所看和所聽到的內容，該公司願意與AI公司合作，共同改進，以服務受眾。