【要聞中心/綜合報導】全球人工智慧蓬勃發展,如何掌握話語權是關鍵議題,「主權AI(Sovereign AI)」發展備受矚目。數位發展部表示,本月(6月)開始與各部會盤點語言資料,評估納入AI訓練語料庫,目前確定會放入客語、原住民語。數發部同時研議語料庫行動計畫,盼政府機關和民間響應資料共享與活化應用,預計2、3個月內,將釋出第一階段語言資料,屆時包括政府法人或產業都可申請使用。

立法院交通委員會今天邀數發部長黃彥男就「推動AI之產業發展政策」進行專題報告並備質詢。

民進黨立委徐富癸關注,數發部正推動台灣主權AI語料庫,但現在語言資料可能偏重政府文書資料,擔心出現語料偏誤,詢問未來資料庫是否計畫加入原住民族語言與客語等。數發部資料創新司司長莊明芬指出,客語、原住民語言的資料,會納入語料庫。

此外,語言資料庫將包括文化、歷史、地理等豐富語言資料,本月會找各部會盤點重要語料庫,近期也在研擬語料庫行動計畫,後續搭配數發部提出的AI語料授權條款,就可以對外釋出。至於時程,莊明芬表示,目前正在做基本訓練,同步建置系統,首要工作是先充實語言資料,預計2到3個月後,會先釋出第一階段語料。

黃彥男強調,打造主權AI關鍵在於資料,主權AI語料庫是未來AI基本法中重要資料治理面向。

族群媒體突圍/內容才是重中之重 語言與文字不必同步

【蔡依璇、李台源、范修語/台北報導】伴隨網路科技襲捲而來的數位狂潮,對族群媒體而言,究竟是助力?還是毀滅力?母…

主權AI
主權AI指的是一個國家不依賴他國,自主掌控從資料蒐集、模型訓練、演算法開發到最終應用的垂直產業鏈整合,也是具有戰略意義的技術資產。其核心目標在於確保資訊流通、數據治理的自主性、維護關鍵基礎設施的數位安全,進而保障國家數據主權。

數發部長黃彥男(圖)18日立法院答詢時表示,打造主權AI的關鍵在資料,台灣主權AI語料庫也是未來AI基本法中的重要資料治理面向。數發部指出,預計2到3個月可先把第一階段的語言資料釋出。中央社
數發部長黃彥男(圖)18日立法院答詢時表示,打造主權AI的關鍵在資料,台灣主權AI語料庫也是未來AI基本法中的重要資料治理面向。數發部指出,預計2到3個月可先把第一階段的語言資料釋出。中央社