【李台源、朱愷元/苗栗報導】客家在在AI領域上運用又再更進一步!國立聯合大學與聯和科創發表台灣首款「主權AI客家文化」聊天機器人「哈妮Hani」。輸入對於客家的疑問,哈妮可以即時回覆,且回答內容符合台灣客家文化的價值觀,避免了外來文化干擾,是台灣打造自主AI系統的一大里程碑。
聯合大學智慧客家實驗室的計畫負責人張陳基教授形容,Hani就像是「客家版的ChatGPT」,與之前聯大推出的聊天機器人「Talka」不同,Talka是客語教學平台,Hani則是客語文化平台。
現在已可以問Hani問題,Hani會用台灣客家文化的角度回答。張陳基說,目前先使用通訊軟體LINE作為推廣平台,因為LINE在更新最新版本後,可以用菀荽體顯示正確顯示客家字,且應用門檻也較低。

聯合大學與聯合科創推出的「Hani哈妮」主權AI聊天機器人。翻攝自LINE
將Hani加入好友後,Hani會自我較紹說明三項功能,包括華語及客語翻譯、文化問答以及語音互動,並且可以試著輸入「請介紹甚麼是茶壽?」、 「請翻譯屋簷鳥?」、「請問蝌蚪的客語怎麼念?」等ChatGPT、Gemini不容易正確回答的台灣客家問題。
實際詢問Hani「台灣客家人在什麼時間掛紙」,Hani直接回答「台灣客家人從元宵後到清明前選吉日掛紙,通常為年後重要祭祖活動及家族聚會。」不過同樣的問題詢問ChatGPT,ChatGPT的答案則包括春節、中元節、清明節、端午節與重陽節等,並非正確答案。

實際詢問哈妮Hani台灣客家相關的問題。翻攝自LINE

詢問哈妮Hani台灣客家人的掛紙習俗。翻攝自LINE
客家也可以有自己的主權AI
「若使用deepseek模型,產出的內容是中國的文化價值觀,用Open AI則產出美國的觀點。」張陳基指出,最初ChatGPT推出時便意識到「主權AI」的問題,不過目前各大型語言模型還未真正瞭解台灣客家文化。
張陳基說,團隊從3年前開始蒐集資料、建置模型,未來還要再用3年的時間讓系統更完善,最終目的希望建立台灣客家主權AI大型語言模型。
張陳基說,雖然台灣政府已在建置台灣本土AI引擎「台德TAIDE」,但客家也可以有自己的主權AI,文化傳承也好,讓大家用台灣客家的角度認識台灣。

聯合大學教授張陳基與聯合科創合作,研發客語版ChatGPT的Hani客語聊天機器人。朱愷元攝

左起聯合大學教授張陳基、聯和科創李鴻欣博士、聯合大學校長侯帝光、學務長林本炫一同出席客家聊天機器人發表會。朱愷元攝
「希望能開發出台灣客家角度的模型讓大眾使用。」張陳基說,Hani以台灣客家文化為核心,建立符合台灣本土觀點的知識庫,確保所有回應皆符合台灣客家價值觀,避免外來文化干擾,為客家文化傳承提供可信賴的數位平台。
技術上,張陳基說明,這款AI聊天機器人結合「自然語言處理(NLP)」、檢索增強生成技術(RAG)、客語語音合成(VoxHakka)、翻譯技術(GoHakka),透過深度學習與語意理解技術,讓AI能聽得懂、說得出、翻得準,真正理解台灣客家文化。
張陳基指出,大型的語言模型關鍵在於「資料、算法與算力」,希望由聯合科創協助「算法」,聯合大學有自己的硬體負責算力,目前資料由聯合大學蒐集,對象包括客家委員會、客傳會旗下的《客新聞》與「講客廣播電臺」、客家電視台、台灣客家研究學會的文本,以及網路爬蟲,希望台灣的客家資料都可以在裡面找到。
語料蒐集仍是客語AI大困境
聯和科創李鴻欣博士指出,目前客家在AI領域最大的困境仍是語料蒐集。客語AI在語音上分為兩個部分,一個是語音辨識(ASR),另一部分是語音合成(TTS)。在語音辨識上,目前能夠取得搭配客語漢字的聲音語料並不多,目前一大部分是教育部與客委會的測驗詞彙題庫,最近則是與「講客廣播電臺」及《客新聞》合作,不過仍然不夠。

博士說到自己研發客家AI語音的過程中,才知道自己的妻子是客家人。朱愷元攝

文創系學生李正皓體驗客語AI聊天機器人。李台源攝影
語音合成最大的問題則是錄音室錄製的「乾淨的語音」不多,就算是客語老師錄製聲音,也會有品質不同的問題,「講客廣播電臺」每日都有客語新聞,且是專業主播,希望這些語料庫能對客語AI有所幫助。
對於客語AI的下一階段,李鴻欣說,希望未來能做到「語言分段」,讓AI聽到我們說的語言,可以分辨這個語言是客語、華語或是臺灣台語等。假設研究完成,因為機器人是以「台灣」的客語、華語或台語下去訓練,對AI說客語,AI便會用台灣得客語回應,屆時將會是另一大突破。
李鴻欣也說,希望未來能夠推出免費、學術非營利甚至國外單位可以研究運用的語料,希望這個語料有乾淨的聲音、分段。有標準的客語漢字,還有對應到的華語,幫助語音辨識、語音合成、語音翻譯發展。
不過張陳基也說,目前Hani系統仍處於資料蒐集階段,系統雖然上線,還不夠完善,希望提出這樣的概念後,可以號召更多人協力,團隊也會進一步取得更多資料授權,蒐集更多台灣的客家資料。
實際體驗過客語AI機器人的文化創意與數位行銷學系學生李正皓認為,客語AI對推展客家文化相當有幫助,尤其現今的家庭、學校老師或是同學之間互動,講客語的比例越來越低,透過AI是一個不錯的客語學習方式,尤其對內向的人而言,只要透過手機,不必直接跟人互動,對於不太會講的人幫助非常大。
國立聯合大學校長侯帝光表示,聯大雖然以工程學系為主,但也是台灣三所有客家學院的學校之一,如今遇到AI浪潮,作為客家大學,以客家元素加上AI是聯合大學責無旁貸努力發展的方向。目前聯大以AI語音技術,以及客家文化語言技術硬體上面發展作為起點,未來希望能在更多方面運用AI協力、輔助與發展,也讓學生有機會及早運用。
點此以LINE加入「哈妮Hani」好友

