根據英國金融時報報導,中國最近試圖控制人工智慧,訓練出「習近平思想」的聊天機器人,以各種形式傳播關於中國共產黨政治、經濟和文化的想法,確保中國人民思想、政治和行動,與以習近平為核心的中國共產黨中央一致。
據金融時報查閱的部分資料顯示,大量培訓材料來自政府法規、政策文件、國家媒體報導和官方出版物。
資料的幾十份文件當中,約有 86,314 處提到習近平,當中更表示「讓我們更加緊密地團結在以習近平同志為核心的黨中央周圍。」
中共中央網絡安全和信息化委員會辦公室旗下雜誌「中國網信雜誌」於 20 日,發表一篇關於中國第一個網信研究大型語言模型(LLM)的文章表示,語料庫的專業性、權威性保證了生成內容的專業性。
此中國最新的大型語言模型語料庫一直在學習「習近平新時代中國特色社會主義思想知識庫」的政治哲學,以及中央網信辦的其他官方文獻。
中國政府推出以「習近平思想」為訓練對象的聊天機器人,將使人工智慧向中國網友提供訊息的方式遭到控管,讓中國的言論自由更加嚴厲控制,並期望與 Open AI 的 ChatGPT 競爭。
據參與該專案的人士表示,目前新模型正在強大的網路監管機構下屬的一個研究中心使用,最終可能會被廣泛使用,功能包含可以回答問題、建立報告、總結資訊,及中英文互譯等功能。
目前已有十幾本書以習近平的名義出版,他的暢銷書通常在全國書展上佔據中心位置,騰訊或網易等公司的熱門新聞應用程式,在官方媒體的頂部保留時段,大部分時間也都以習近平為主角。
中國官方更要求年僅 10 歲的學童學習習近平的政治哲學,建立了宣傳習思想的「學習強國」應用程式。
而中央網信辦此前發布生成式人工智慧規則,並引入許可制度,規定生成式人工智慧提供商必須體現「社會主義核心價值觀」,要求生成內容不能包含「顛覆國家政權」的內容,公司須對自家人工智慧產出負責。
不過對於模型開發人員來說,這是一個特別的挑戰,因為可用於訓練 LLM 的法學中文數據相對稀少,大多數小組也使用英語資訊進行培訓,但這可能導致人工智慧產生不符合中國規範的回覆。
為了幫助開發人員解決這個問題,與中央網信辦結盟的非營利組織─中國網絡空間安全協會,於去年 12 月發布第一個包含 1 億個「高品質和可信資料」條目的公共資料庫,供各團體在模型培訓中使用。 根據英國《金融時報》審查的部分內容,該培訓集大量借鑑了政府法規和政策檔案、國家媒體報道和其他官方出版物。
而百度和阿里巴巴等科技巨頭也已確保其模型嚴格控制生成與習近平或其他潛在敏感問題相關的內容。當被問及敏感話題時,這兩家公司的聊天機器人會要求用戶重啟聊天。
參考資料:
2024/05/22 Financial Times China’s latest answer to OpenAI is ‘Chat Xi PT’