【生活中心/綜合報導】歐洲廣播聯盟(European Broadcasting Union, EBU)今天(22日)公布一項大規模研究顯示,ChatGPT之類的人工智慧(AI)助理,回答有關新聞事件的問題時,存在普遍且系統性的問題,無論使用何種語言、地區或 AI 平台,45% 的 AI 回答至少包含一個重大問題,嚴重地誤傳新聞內容。
這項研究涵蓋了來自18個國家、使用14種語言的22家公共服務媒體機構,評估OpenAI的ChatGPT、微軟(Microsoft)的Copilot、谷歌(Google)的Gemini 和Perplexity等四大AI平台的3千多個回應。
報告說,整體而言,45%的AI答覆「至少有一項重大問題」,而且不分語言或來源國家。每5則答覆中就有1則「存在嚴重的正確性問題,包括虛構細節與過時資訊。」
研究報告指出,4款AI助理之中,「Gemini的表現最差,76%的回應中,出現重大問題,比例是其他助理的兩倍以上,主要和資訊來源表現不佳有關。」
這項研究在今年5月底至6月初進行,透過全球22加公共媒體機構、14個與腫的專業記者,分別根據準確性、來源引用、區分事實與意見、提供背景資訊等標準評估AI助理的回覆,發現以下主要問題:整體發現45%的AI回覆至少有一個重大問題;31%的回答存在嚴重的遺漏、誤導或不正確的消息來源歸屬問題;20%的回答包含重大準確性問題,包括捏造的細節(幻覺)和過時的資訊。
例如,問到「教宗是誰」時,ChatGPT告訴芬蘭國家廣播公司是「方濟各」(Francis);Copilot和Gemini給荷蘭廣播基金會(NOS)和荷蘭公共廣播(NPO)的答案也是「方濟各」,但當時他已過世,由良十四世(Leo XIV)接任。
法國廣播電台(Radio France)詢問關於馬斯克(Elon Musk)在1月美國總統川普就職典禮上疑似行納粹禮的傳聞時,Gemini回答說這位億萬富豪「右臂勃起」,顯然是把一位喜劇演員的諷刺專欄,當作事實內容。
歐洲廣播聯盟副秘書長坦德(Jean Philip De Tender)與英國廣播公司(BBC)AI主管阿契爾(Pete Archer)表示:「AI助理仍不是獲取和瀏覽新聞的可靠方式。」即便有這些缺陷,AI助理在獲取資訊方面的使用率仍持續增加,尤其受到年輕人青睞。
EBU 媒體總監Jean Philip De Tender指出,這項研究「確定性地顯示,這些失誤不是孤立事件,而是系統性、跨國界和多語言的,」,並且「危及公眾信任。」而AI 助理正取代許多用戶的搜尋引擎,7%的網路新聞消費者使用AI獲取新聞,在25歲以下群體中,這一比例更高達15%。
研究團隊為了解決這些問題,發布《AI 助理中的新聞誠信工具包(News Integrity in AI Assistants Toolkit)》,希望幫助開發解決方案,該工具包探討「一個好的 AI 助理新聞回答應具備什麼?」及「需要修復哪些問題?」。
另外,EBU及其成員,正敦促歐盟和各國監管機構執行現有法律,內容涵蓋資訊誠信、數位服務和媒體多元化。有鑒於AI發展快速,他們強調持續進行獨立監測至關重要,正尋求資源持續進行這項研究。
英國廣播公司(BBC)節目總監Peter Archer表示,他們對AI感到興奮,但用戶必須能夠信任他們所讀、所看和所聽到的內容,該公司願意與AI公司合作,共同改進,以服務受眾。


