編按:客家公共傳播基金會日前以「數位競爭下,族群媒體如何突圍」為題,舉辦年度諮詢座談會議,邀請學術界、媒體界等各領域專家學者,分享經驗、碰撞思維火花。
國立陽明交通大學榮譽教授張維安以「演算法偏見」為例撰文,提出族群媒體不僅面臨「小眾」的問題,更受到語言、互動人數、商業和政治的限制,淹沒在演算法的洪流中。《客新聞》將分4天刊登全文,盼有助於大眾討論數位時代下,如何確保族群文化的公平傳播。
文/張維安(國立陽明交通大學榮譽教授)
在數位時代,演算法是數位平台上控制內容曝光率的關鍵技術。無論是 YouTube 的推薦系統,還是 Facebook、Instagram 上的內容排序,演算法會根據過去的用戶行為來決定哪些內容值得推廣。這樣的機制對主流文化有利,但對像客家族群這樣的小眾文化來說,卻會面臨演算法偏見的挑戰。
演算法偏見的形成
演算法偏見是指由於數據、設計或商業目標(或政治目的)限制,導致某些內容或文化在數位平台上被邊緣化。客家族群的文化和語言,由於點擊率和互動量低,往往被認為「不具吸引力」,這樣會帶來平台的演算法忽略這類內容,從而進一步降低其曝光度。帶有商業目標演算法,可能會影響平台優先推廣能夠吸引大量互動和廣告收入的主流內容,這也使得文化性或教育性的小眾內容難以被廣泛推廣。
演算法偏見是現代數位平台常見的問題,特別是在推薦系統中,這些偏見會影響哪些內容能夠被看見,哪些內容會被忽略。演算法偏見的形成來自多個方面,包括數據來源的不均衡、平台的商業(或其他)目標、文化和語言的差異等。我們可以進一步來看這些因素,並了解一下這些偏見是如何形成的。
數據偏差(Data Bias)
首先,數位平台的演算法依賴大量數據來進行學習,這些數據是基於使用者的歷史行為,比如他們點擊了哪些影片、與哪些內容進行了互動。如果大部分數據來自於某些主流文化或語言,演算法就會認為這些文化或語言最受歡迎,並優先推薦相關內容。相反,小語種或小眾文化的內容由於缺乏足夠的數據支持,會被演算法視為「不具吸引力」,從而降低其曝光率。
以 YouTube 為例,如果多數用戶主要觀看英語或華語影音,平台就會收集這些語言的點擊數據,並依據這些數據向更多人推薦類似語言的影片。這就使得像「客家語」這樣的小語種影片,由於觀看次數相對較少,不會被演算法認為是「受歡迎」的內容,進而不被推薦。即使客家語的影片質量很高,這些數據偏差依然使得它們很難在平台上獲得更多曝光。
商業目標導向(Commercial Objective Bias)
其次,數位平台的首要目標是增加使用者在平台上的停留時間,從而提升廣告收益。為了達成這個目標,演算法會優先推送那些容易吸引大量互動和點擊的內容,這通常是一些流行、娛樂性強的影片,而不是教育性或文化性的小眾內容。因此,像「客家文化」這樣的內容,因為互動數據不如流行文化內容高,平台會認為這類內容「無法創造足夠的經濟效益」,而將其降級處理,難以推送給更廣泛的受眾。
在 Instagram 上,演算法會優先推送一些具有高互動性的流行話題,如名人新聞或病毒式的搞笑影片。相比之下,像介紹「客家文化傳統服飾」或「歷史故事」的貼文,因為相對來說不具備「爆點」,互動數據較低,無法吸引平台的關注和推薦。這導致「族群文化內容被隱藏在流行文化之後,無法進入主流受眾的視野」。
語言與文化的偏見(Linguistic and Cultural Bias)
第三,數位平台的演算法更偏向於推廣使用主流語言的內容,因為這些語言能吸引更大的全球用戶群。例如,英語被廣泛使用,因此與英語相關的內容在平台上的點擊和互動數據會比較高。這讓演算法認為英語內容更值得被推薦。而「小語種內容」,由於使用者數量少,互動數據低,難以被系統認為「有價值」。因此,演算法會自動降低這些小語種內容的推薦機率。
例如,在 Netflix 上,英語影片或美國製作的影集經常被推送給全球用戶,這是因為平台認為這些內容可以吸引最多觀眾觀看。相比之下,像「台灣客家語紀錄片」,由於觀看次數和互動數據較少,平台的演算法會自動降低這類內容的推送機率,這使得即便這些紀錄片有深厚的文化價值,觀眾也不容易在首頁或推薦欄目中看到它們。
演算法偏見的循環效應
第四,當演算法基於上述偏見進行推薦時,這些推薦結果會進一步強化原有的偏見,形成一種「強者恆強,弱者恆弱」的負面循環。例如,當客家語的內容因互動數據低而不被推薦時,這些內容就會失去進一步被點擊和互動的機會,導致互動數據更低,最終陷入一個「不斷被忽視的惡性循環」。主流文化內容則因為有更多的互動和推薦,會「持續增加其可見性」,讓小眾文化的傳播難上加難。
例如,如果「客家文化」相關的影片因為觀看次數低而無法被 YouTube 推薦,這些影片就不會被更多新觀眾發現。沒有新的觀看者進一步點擊和互動,這類影片的數據也無法提升,最終導致平台繼續認為這些內容不值得推廣。這樣的偏見循環「讓小眾文化更難在數位平台上獲得長期的曝光機會」。」
小結
演算法偏見的形成來自於數據的偏差、平台的商業利益(或其他的其他目的之意圖)和語言文化的差異。對於客家族群這樣的小眾文化來說,這些偏見導致其內容在數位平台上難以被看見,進而影響文化的傳播與發展。要解決這一問題,必須通過增加數據多樣性、提升內容互動性以及倡導平台提高透明度,從而讓小眾文化有更多機會突破這些數位偏見,實現文化的持續傳播。