• 關於我們
  • 隱私權
  • 服務條款
  • 聯絡我們
  • 講客電臺
  • 國客兒
  • 客傳會
訂閱我們
2023年3月31日星期五
客新聞 HakkaNews
20230206-news
  • 熱門
  • 焦點
  • 要聞
    • 土耳其強震
  • 生活
  • 話題
  • 專欄
  • 專題
  • 國際
    • 烏克蘭
  • 新聞學客語
  • 寫客文
  • 客人誌
  • 客童話
  • 客庄
  • 專業客
  • 3C
    • 客站
  • 美食
  • 玩樂
  • 客影
  • 藝所
  • 饒平
  • 詔安
  • 1786平民戰士
  • 向原民學習
沒有結果
看所有最近的文章
  • 關於我們
  • 隱私權
  • 服務條款
  • 聯絡我們
  • 講客電臺
  • 國客兒
  • 客傳會
沒有結果
看所有最近的文章
客新聞 HakkaNews
沒有結果
看所有最近的文章
  • 熱門
  • 焦點
  • 要聞
  • 生活
  • 話題
  • 專欄
  • 專題
  • 國際
  • 新聞學客語
  • 寫客文
  • 客人誌
  • 客童話
  • 客庄
  • 專業客
  • 3C
  • 美食
  • 玩樂
  • 客影
  • 藝所
  • 饒平
  • 詔安
  • 1786平民戰士
  • 向原民學習
首頁 專欄

【專業客】ChatGPT正火熱 AI人工智慧對客家的偏見?

客新聞 by 客新聞
2023 年 3 月 3 日
in 專業客, 焦點, 講客電臺新聞
閱讀時間: 1 分鐘
A A
【專業客】ChatGPT正火熱 AI人工智慧對客家的偏見?
分享到臉書分享到Twitter分享到Line

編按:《客新聞》將不定期推出【專業客】專欄,我們邀請各行業的專家、學者或是經驗豐富的職人,對當下新聞熱門議題,發表最專業的看法,試圖在各種網路帶風向、假訊息當道的時代,提供理性思考的方向。

【專業客】張陳基 教授

「今晡日个科技,天光日个客家!」最近,人工智慧(Artificial Intelligence, AI)的應用已經逐漸普及到我們日常生活的各個領域中,尤其是ChatGPT聊天機器人成為火熱話題,它採用OpenAI的GPT-3.5語言模型,GPT( Generative Pre-trained Transformer)採用AI中生成式預訓練的技術。根據台灣大學電機工程學系李宏毅教授的解析,ChatGPT的訓練學習是透過閱讀大量的文本資料,再經由專家校對,引導語言模型更接近人類對話的方式。由此可知,AI有一個最大的限制-資料偏差問題(Data Bias),就是在訓練的時候需要大量的文本語料,而這也造成了AI對客家的偏見。

◾問客家文化AI亂答一通,客語「低資源語言」成關鍵

如果你問ChatGPT客家相關的問題,你會發現聊天機器人好像對於客家文化不是很了解,例如問在台灣,客家人的分佈區域?AI會回答「台灣客家人的主要分佈區域是在台灣中部和南部地區,特別是在新竹、苗栗、台中、彰化、雲林、嘉義和屏東等縣市。」很明顯它回答的資訊並非完全正確。

如果你再問他有關於客家語言或文化的相關問題,很有可能都回答錯誤。為什麼呢?那是因為在開發AI聊天機器人時,需要大量的文本語料來進行訓練語言模型(Large Language Models),也就是透過大量的文本語料來教導聊天機器人如何去回答問題,但是關於客家語言和文化的相關文本語料量卻是相對非常少,尤其是客家語言。

AI回答客家問題不精確,原因在於客家語言的低資源。洪俊傑攝

客家語言在人工智慧技術開發上被視為是低資源語言(Low Resource Language)。對於人工智慧而言,低資源語言是指可用於訓練機器學習模型的數位化資料數量有限的語言。這些語言擁有非常稀少的數位化資源,包括建構和改進AI 應用程式所必需的文本語料庫、語音數據等。AI人工智慧透過主流語言的模型訓練,讓華語的辨識、語音合成更加流暢,造成客家語言的邊緣化,進而加劇這個問題。

這是因為大多數 AI 語言模型都是在高資源語言(例如英語或華語)的大型數據集上訓練的,這可能會導致在低資源語言上表現不佳。因此,客家族群可能無法享受AI技術帶來的好處,例如語音助理或機器翻譯,這些技術通常只適用於高資源語言。這可能會導致客家語言和文化進一步被邊緣化,講客語的人就被迫切換到使用便利的語言以獲取相關資訊和參與主流社會的網路社群。

那麼,如何解決AI對客家的偏見問題呢?首先,需要儘可能減少資料偏差。這可以通過增加資料的多樣性、確保資料的平衡性等方式來實現。客家語言資料的匱乏是客家語言文字推廣和文化傳承的重大障礙。沒有足夠的語言資源和數據,就很難開發出有效的語言模型和AI應用。

因此,我們需要多方合作,例如將客委會發展的臺灣客語語料庫,包括文本語料、口語語料都納入訓練資料集,只有這樣,我們才能更好地應用AI,實現人工智慧技術在各個族群的多樣性發展,並且確保對所有族群文化都被公平的對待。

◾文化同質與族群族流成為文化多樣性的矛與盾

也因為人工智慧沒有人類時間與空間的限制,透過海量的訓練,讓高資源語言被普及應用,也相對的造成低資源語言愈來愈被弱化的情況下,導致文化同質化(Cultural Homogenization)的問題。文化同質化就是指不同族群的傳統文化、習俗跟信仰被單一的主流文化所取代,全球化及網路媒體的興起造成了文化同質化的情形,而人工智慧的發展則會讓問題更加嚴重。

原因是AI通常是在偏向主流文化和語言的大型資料集上開發和訓練的,這可能導致AI優先考慮並強化主流文化傳統和價值觀,同時邊緣化客家或是其他族群文化。低資源語言資料的缺乏,也意味著AI可能無法準確反應少數族群的傳統、歷史、語言和文化多樣性,導致文化表現的同質化,只有主流文化和高資源的語言能夠呈現在AI生成的內容中。

因此,文化同質化和族群主流化是在文化多樣性和客家文化推廣背景下經常被討論的兩個互斥的概念,分別代表了處理文化多樣性的不同方法,文化同質化是指不同的文化表現形式和習俗被單一主流文化所取代的過程,最終結果是文化多樣性的喪失和同質化、標準文化的出現。族群主流化是指將不同的文化表現形式和習俗融入主流文化的過程,強調文化多樣化的價值,並力求促進少數族群融入主流社會的公平參與。

張陳基教授對AI發展保持信心,但認為需把關族群的多元性。宋佩瑤攝

◾AI發展可能傷及族群主流化,需培養族群文化素養把關

目前AI的發展,很有可能對於台灣辛苦推動的族群主流化成果造成巨大的傷害,讓客家文化再次被排除到主流社會之外。要解決AI所導致文化同質化問題,首先,就應該推動AI的族群主流化,讓AI的發展具有文化多樣性以及公平參與性。在開發國家型AI計畫時可以考慮團隊成員的多樣性,讓不同族群背景的專家學者共同參與設計開發過程,確保AI設計考慮到族群文化的多樣性,避免產生同質化問題。

其次,訓練資料的多樣性,AI的發展會採用大型資料集進行訓練,確保這些資料集的多樣性和包容性非常重要。 需要確保這些資料是從不同的文化背景中收集而來,並在使用資料過程中避免產生資料偏差的情形,將客家文化知識融入AI,使用自然語言處理技術來辨識和翻譯文化特色詞彙,並加入訓練資料集。

最後我們應建立族群主流化的檢測機制,從培養人員族群素養、文化意識,以及對不同文化尊重的敏感度下把關,確保資料蒐集、模型訓練過程兼顧到各族群的利益,並且由外部人員評估成果的公平代表性及多樣性。將這些策略納入AI設計和實施計畫中,可以確保族群文化不會被AI同質化,並讓AI可以接受公平性和多樣性的訓練,有助於數位時代下族群主流化社會的永續發展。

【專業客】張陳基教授
經歷:
國立聯合大學教授,新竹關西客家人,任教於客家研究學院文化創意與數位行銷學系,開發有客語翻譯系統、客語聊天機器人阿知牯(Talka)。

關鍵字: AIChatGPT人工智慧客語張陳基
加入好友
上一篇

世界棒球經典賽8日登場 中市旅館訂房率增溫

下一篇

烏克蘭聯合芭蕾舞團訪台「戰時輓歌」祈願和平

RelatedPosts

盧超群:未來5年全世界都在拚AI 台灣不應是追隨者
即時

盧超群:未來5年全世界都在拚AI 台灣不應是追隨者

2023 年 3 月 29 日
「阿知牯」機器人會講客 苗栗高中結合AI鼓勵學生多元學習
話題

「阿知牯」機器人會講客 苗栗高中結合AI鼓勵學生多元學習

2023 年 3 月 25 日
微軟繼OpenAI後再推繪圖平台 AI畫出驚人細節秒當「繪畫大師」
3C

微軟繼OpenAI後再推繪圖平台 AI畫出驚人細節秒當「繪畫大師」

2023 年 3 月 22 日
下一篇
烏克蘭聯合芭蕾舞團訪台「戰時輓歌」祈願和平

烏克蘭聯合芭蕾舞團訪台「戰時輓歌」祈願和平

何來美專欄/都會客家人應勇於參政

何來美專欄/都會客家人應勇於參政

1786平民戰士 1786平民戰士 1786平民戰士

☑ 訂閱並追蹤我們的臉書

♨ 熱門新聞

  • 義民廟春祭大典 賴清德:團結是義民精神對台灣最重要意義

    義民廟春祭大典 賴清德:團結是義民精神對台灣最重要意義

    21 分享數
    分享 8 Tweet 5
  • 狒狒脫逃非首例 曝22年前東南亞最大「ㄅㄆㄇ猴園」現況

    12 分享數
    分享 5 Tweet 3
  • 一生匠人魂/湖口客庄郵務士戴臣佑 《海角七號》寄出40年前尋人信件

    215 分享數
    分享 86 Tweet 54
  • 實測/11萬買特斯拉 EAP 值得嗎?這五種人別猶豫 刷下去!

    433 分享數
    分享 173 Tweet 108
  • 美濃四月櫻盛開 湖畔市集樁粢粑滿額送門票

    6 分享數
    分享 2 Tweet 2
  • 台灣客庄柑橘做果醬世界冠軍! 英國名廚勒帕德:經得起考驗、足以自豪

    6 分享數
    分享 2 Tweet 2
  • 桐花三行詩徵選出爐 永定腔《桐花靚》自1500首詩中脫穎而出奪金賞!

    121 分享數
    分享 48 Tweet 30
  • 8萬株海芋5米高青鳥打造最大花園 4/1大園綺麗登場

    5 分享數
    分享 2 Tweet 1
  • 狒狒逃脫死亡 六福村總監鞠躬致歉:「暫時關閉野生動物區、全面盤點數量」

    5 分享數
    分享 2 Tweet 1
  • 台中市2層樓民宅倒塌 1人送醫不治、2人受困待援

    11 分享數
    分享 4 Tweet 3

新聞來一客

何來美專欄/尋訪北台灣「客家底」足跡
專欄

何來美專欄/尋訪北台灣「客家底」足跡

2023 年 3 月 31 日
因應東亞局勢升溫 美軍匿蹤戰機進駐沖繩空軍基地
國際

因應東亞局勢升溫 美軍匿蹤戰機進駐沖繩空軍基地

2023 年 3 月 31 日
金曲歌后官靈芝喚起愛女「追尋音樂的心」 林沛蕎推首張客語專輯
話題

金曲歌后官靈芝喚起愛女「追尋音樂的心」 林沛蕎推首張客語專輯

2023 年 3 月 31 日
新北客家青年展現新美學 跨域媒材藝術創作特展
生活

新北客家青年展現新美學 跨域媒材藝術創作特展

2023 年 3 月 31 日
穩物價過好年 經濟部:春節期間油氣價凍漲
新聞學客語

國際油價起價 下禮拜汽油評估起價0.5元

2023 年 3 月 31 日
宜蘭綠色博覽會今開幕 近萬人湧入享受大自然
生活

宜蘭綠色博覽會今開幕 近萬人湧入享受大自然

2023 年 3 月 31 日

關於我們

財團法人客家公共傳播基金會簡稱客傳會,是中華民國公共媒體機構之一,由客家委員會資助,2019年成立;目的在經營文化傳播媒體事業,並傳承客家文化教育,基金會旗下有經營講客廣播電臺(Hakka Radio),是台灣第一個全國性的客語廣播電臺,擁有台灣最多客語節目的音檔,以及最豐富的線上隨選收聽 (AOD),每日播報八節全客語新聞。

客傳會 2022 年新成立的客新聞 (Hakka News),屬於客傳會旗下的客家新聞傳媒平台。透過報導海內外重要新聞、客庄大小事,連結客家,期待更多人共下看見客家的美好。

歡迎在網路上追蹤與訂閱我們

推薦閱讀

精靈系歌手與劇團舞團共下煞猛演出生命力 宜蘭綠博精彩開幕

精靈系歌手與劇團舞團共下煞猛演出生命力 宜蘭綠博精彩開幕

2022 年 3 月 26 日
蕭秀琴專欄/海味,與海的距離沒那麼遠

蕭秀琴專欄/海味,與海的距離沒那麼遠

2022 年 10 月 17 日
台灣之光!紐約電影獎告捷 客傳會《浮光童夢—五溝水》入圍

台灣之光!紐約電影獎告捷 客傳會《浮光童夢—五溝水》入圍

2022 年 3 月 7 日
  • 關於我們
  • 隱私權
  • 服務條款
  • 聯絡我們
  • 講客電臺
  • 國客兒
  • 客傳會

Copyright © 2022 客新聞 HakkaNews - 屬於 財團法人客家公共傳播基金會。All rights reserved.

沒有結果
看所有最近的文章
  • 客新聞
  • 1786平民戰士
  • 熱門
  • 即時
  • 焦點
  • 要聞
  • 生活
  • 客童話
  • 話題
  • 客庄
  • 專題
  • 藝所
  • 玩樂
  • 美食
  • 一等慶
  • 客站
  • 客影
  • 客人誌
  • 客傳會
  • 隱私權政策
  • 服務條款
  • 關於客新聞 | HakkaNews

Copyright © 2022 客新聞 HakkaNews - 屬於 財團法人客家公共傳播基金會。All rights reserved.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist