AI與風險社會》傳播學者陳慧蓉: AI 資料庫應本土化 避免生成充斥外來語

由台灣獨立建國聯盟、台灣安保協會、現代文化基金會、新台灣和平基金會主辦的「AI與風險社會」講座,邀請到文化大學新聞系教授陳慧蓉、文化大學哲學系教授吳豐維,以及台灣勞工陣線秘書長孫友聯到場分享  AI 發展背後的風險,並由黑熊學院執行長朱福銘主持綜合討論。

由台灣獨立建國聯盟等團體主辦的「AI與風險社會」講座,廣邀各界專家與談。(圖/台獨聯盟)

延伸閱讀:AI 與風險社會》哲學教授吳豐維: AI 需反應台灣主權、特有價值
AI與風險社會》勞團孫友聯: AI 恐帶來科技性失業 推動發展應兼顧勞工權益

傳播學者陳慧蓉:面對 AI 風險 政府應建構安全、本土化資料庫

文化大學新聞學系的陳慧蓉教授探討了人工智慧(AI)對新聞業及社會的影響。陳慧蓉將 AI 背後的風險比喻為「進擊的巨人」,建議應該築起風險防範的三道城牆:「主權資料庫建置、責任應用與發展、人工智慧公民識讀」。

  • 陳慧蓉透過科技圈最近的呼籲:政府、企業、公民社會應持續研究 AI ,並發展更安全的規範。

此外,陳慧蓉強調AI背後的數位學習與人類的語言學習模式不同,社會應該關注未來 AI 數位系統學習失控時,政府、社會該如何制止。

陳慧蓉提醒應注意 AI 資料庫本土化,避免生成充斥外來語。(圖/台獨聯盟)

歐盟《人工智慧法》將 AI 風險分級 制定不同強度規範因應

陳慧蓉提到,被稱之為「AI教父」的前 Google 執行長辛頓(Geoffrey Hinton) 已指出幾個 AI 風險: 

  • 一、被惡意國家、組織、個人所錯用
  • 二、造成科技性失業(尤其是機械性與記憶性的工作,例如法務助理,個人助理,翻譯等)
  • 三、通用人工智慧對人類社會的存在性威脅(例如:個人及公司讓AI系統不僅發展自己的程式碼,也開始跑自己的程式碼 ,如同火車開始蓋自己的軌道))。

陳慧蓉連結到今(2024)年 8 月 1 日上路的歐盟「人工智慧法」(AI Act),以「風險」為主軸區分 AI 的四種風險,分別為:

  • 一、「不可接受風險」(Unacceptable Risk)是完全禁止,例如:社會信用積分系統、操弄型AI;
  • 二、「高風險」(High Risk)也是歐盟AI法案主要規範對象;
  • 三、有限風險(Limited Risk)針對透明化規範,開發者及部署者必須讓終端使用者知道他們是與AI互動,例如: 聊天機器人,深偽,AI生成照片);
  • 四、「最低風險」(Minimal Risk)則不受歐盟 AI 法案所規範,例如:AI電玩,垃圾郵件過濾器等。

陳慧蓉提到歐盟對AI的規範,隨著生成式AI的發展,也會隨之修正。

歐盟 AI 法案中規範 4 種等級的 AI 風險。(圖/europa.eu)

陳慧蓉:國際 AI 易忽略本地文化 台灣主權 AI 發展應廣含原民、性別等議題

陳慧蓉指出,AI 資料庫經常忽視台灣本地文化,導致 AI 生成的內容,經常被外來語充斥,不符合台灣本土特徵。對此,陳慧蓉相當肯定目前以台灣主體性為文本的「可信任生成式 AI 對話引擎」(TAIDE),引入台灣特有的語料庫。

不過,陳慧蓉指出,目前台灣的資料庫中,原住民語言、性別平等意識及運動,或相關的社會議題的呈現還是不足。背後的問題,不只是資料庫,還反映出台灣轉型正義在檔案或論述上進展的遲緩,導致相關資料的釋出,趕不上資料庫的更新。

  • 陳慧蓉指出, 2024 年巴黎奧運台灣之所以被世界看見,不是運動員得多少金牌,而是台灣在性別意識擁抱多元價值,讓我們不同於還充滿性別偏見的國家。因此,

因此,陳慧蓉也呼籲未來台灣的 AI 重點發展,更應該關注轉型正義及永續價值,建構「可信任」AI 模型,以反映民主社會的多元性。

TAIDE 模型以具台灣主體性的文本為訓練素材。(圖/行政院)