編按:客家公共傳播基金會日前以「數位競爭下,族群媒體如何突圍」為題,舉辦年度諮詢座談會議,邀請學術界、媒體界等各領域專家學者,分享經驗、碰撞思維火花。
國立陽明交通大學榮譽教授張維安以「演算法偏見」為例撰文,提出族群媒體不僅面臨「小眾」的問題,更受到語言、互動人數、商業和政治的限制,淹沒在演算法的洪流中。《客新聞》將完整全文分作4篇刊登,盼有助於大眾討論數位時代下,如何確保族群文化的公平傳播。
文/張維安(國立陽明交通大學榮譽教授)
透過推動數位平台引入更多來自小語種和小眾文化的數據,讓演算法能夠更公平地學習和推廣這些內容。例如,客家傳播基金會可以與數位平台合作,通過共享數據來優化演算法的推薦機制,提升客家語內容的可見度。
多元化數據訓練 是解決演算法偏見的核心策略之一。演算法的學習與推薦依賴於大量的歷史數據,如果這些數據主要來自於主流文化、語言或行為模式,演算法就會強化這些主流文化的推薦,而忽略小眾文化。因此,要讓小眾文化如客家文化獲得更多推薦機會,必須增加與這些小眾文化相關的數據量,讓演算法能夠從更多元的數據中學習,並識別出小語種和小眾文化內容的價值。
增加數據來源的多樣性
數位平台應該不僅依賴於全球大多數用戶的行為數據,還應該納入更多來自小語種、地方性文化的數據,這樣才能訓練出一個能夠公平對待各類內容的演算法。這可以通過「族群媒體」主動參與來實現,確保平台獲取更多客家語內容的數據,讓演算法不再僅依賴於主流文化數據來進行推薦。
例如,(如前所述)客家公共傳播基金會可以與 YouTube、Google、Netflix 等平台合作,提供專門收集客家語言和文化數據的支持,讓演算法學習如何識別和推廣這些內容。例如,通過推動平台與族群媒體的合作,定期提供一批高質量的客家語內容,並將這些內容的觀看數據、互動數據等送回平台進行分析和學習。這樣可以讓演算法擁有更多元的數據基礎,從而更好地理解小眾文化的價值。
訓練演算法識別文化特色內容
除了增加數據量,還可以通過專門的演算法訓練,讓系統更好地理解文化特色內容。這不僅僅是語言的問題,還包括視覺、歷史背景和文化符號等特徵。通過深入了解客家文化的獨特性,演算法可以更準確地將這些內容推薦給對文化和歷史有興趣的觀眾。
例如,可以考慮與技術公司合作,設計一個專門針對客家文化的內容標籤系統。這個系統會根據客家文化的特徵(如服飾、語言、歷史習俗)自動標註影片或文章,並讓平台演算法學習如何識別這些特徵。當演算法能夠準確辨別這些標籤後,推薦的準確度和頻率就會相應提高。
改善數據的代表性
除了增加數據量,還需要確保這些數據具有足夠的代表性。平台通常使用的數據往往來自某一特定的地理區域或受眾群體,而忽略了其他地區和文化的差異性。多元化數據訓練意味著我們必須確保演算法接收到來自不同地區的數據,尤其是有關地方文化和小語種的數據。
例如,Netflix 可以與客家文化推廣者合作,在全球各地收集更多與客家文化相關的影片觀看數據,包括在台灣、東南亞和海外客家社區的數據,這些數據能幫助 Netflix 理解全球客家族群的興趣點和觀看習慣。這樣,平台就可以針對這些群體進行個性化的內容推薦,從而提升小眾文化的可見性。
將多元文化納入演算法測試
在測試演算法是否公平對待小語種和小眾文化時,平台應該將不同文化背景的內容納入測試範圍,並根據不同文化群體的行為數據來調整推薦邏輯。這樣可以避免因數據偏差而導致的系統性忽視現象。
例如,族群媒體和文化推廣組織可以倡導數位平台在測試演算法時,將客家語、原住民語、閩南語等小語種內容作為特定測試樣本,來衡量演算法對這些內容的推薦效果。例如,平台可以進行一次針對小語種內容的 A/B 測試,觀察平台推薦後的觀看次數和互動數據變化,並根據結果進行優化。
多元化數據訓練是解決演算法偏見的核心策略之一。透過增加數據的多樣性、訓練演算法識別文化特色、改善數據代表性,並將多元文化納入演算法測試,平台將能夠更公平地對待客家語和其他小眾文化內容。這不僅能夠提高小眾文化的曝光率,還能確保不同文化的聲音在數位平台上得到更多的尊重和推廣。
演算法偏見對客家族群媒體的挑戰
面對這種困境,透過多元化數據訓練、提升內容互動性、運用社群力量以及推動平台透明化,小眾族群媒體,「可能」有機會在數位平台上有些突破這,實現文化的傳承與發展。在數位競爭的環境下,積極應對「演算法偏見」對於客家文化的未來至關重要。
要應對演算法偏見,客家族群媒體需要採取多方面的策略,包括提升內容的互動性、運用數據分析、運用社群運動和跨文化合作,並積極推動數位平台的演算法透明化和公平性。透過這些策略,小眾文化能夠在數位時代突圍,獲得應有的曝光和尊重,並讓更多人了解和欣賞其文化價值。這些策略不僅適用於客家族群媒體,也適用於其他面臨數位競爭挑戰的小眾文化在數位世界中獲得更多機會,確保文化傳承不被數位環境邊緣化。
優先進行的建議
一、提升內容的互動性:優先建議:創建更多參與性強的活動,如#HakkaChallenge社交媒體挑戰、客家文化直播問答等,鼓勵觀眾參與互動。這將有效增加客家文化內容的曝光度和演算法推薦機會。
二、運用數據分析來優化內容:優先建議:利用 YouTube Analytics 或 Google Analytics 等工具,深入了解觀眾的觀看行為,找出最受歡迎的內容主題和最佳發布時段,並據此集中資源製作更多符合觀眾需求的內容。
三、社群運動與跨文化合作:優先建議:發起#HakkaCulture 等 hashtag 運動,鼓勵全球客家人和對客家文化有興趣的群體參與分享內容,並與其他小眾文化團體合作,通過聯合活動擴大文化影響力。
四、推動演算法透明化與公平展示:優先建議與數位平台進行對話,推動平台提高演算法透明度,要求對小語種文化內容提供更多公平推薦,並爭取創作者支持計劃,幫助提升客家文化內容的質量和可見性。