在人人都瘋 AI 的時代,如果政論專欄作家不去多方嘗試各種 AI 服務,並且密切注意「台灣在其中的角色」,似乎太過失職。
數位主權,不只是國家的責任,每個使用者也都有自己需要維護跟主張的權益。
這就是我開始使用四大 AI 的原因:Google Gemini、OpenAI ChatGPT、微軟 Copilot、以及 Anthropic Claude。這四大 AI 各自有不同的個性,也非常適合在不同情境底下協助人類工作。儘管一般使用者詬病的「AI 幻覺」偶爾會發生,但只要使用者明白運作邏輯,懂得調整,問題不是特別大。
當我第一次接觸新 AI 時,必定會請它先做兩件事:首先,把所有外文翻譯專有名詞一律比照台灣中央社,其次,絕不在任何情境下便宜行事地提供我「簡中網路資料」。
我寧可請他們給我英文資料,然後再翻譯,也絕對不採信簡中資料,這是基於我的過往經驗。雖然簡中網路資源數量很多,但錯誤跟偏頗也很多。再者,就連繁體中文維基頁面也經常苦於受到簡中社群成員的不當修改,我又何必搬石頭砸自己的腳?
讓人開心的是,四大 AI 都能符合我以上的需求,並且明確的記得我「不喜歡中國詞彙」。同時,我與 ChatGPT 和 Gemini 也曾深入聊過「中文語料及資料庫的極權滲透問題」, ChatGPT 和 Gemini 都能明確回答我,他們母公司是如何努力避免提供偏頗的中國官方說法。
然而,這股對民主世界 AI 建立起來的信心,很輕易的就被 Perplexity 在七分鐘內摧毀了。

圖/wsj
華爾街日報的評測太失水準
就在最近,我看到有媒體引述《華爾街日報》的「AI 大評比」,裡頭宣稱 Perplexity 是什麼「搜尋式 AI 新霸主」、「ChatGPT 被打敗了」,引起我很大的好奇,點進去註冊帳號。結果,只花了短短七分鐘,我就徹底失望,開始尋找怎麼徹底刪除帳號 —— 附帶一提,由於桌機版刪除帳號的按鈕聊備一格,我現在還是刪不了帳號。
Perplexity 不只是介面不好用,操作很麻煩,更糟糕的是它根本就還沒有準備好面對來自台灣這個主權國家的用戶,就被當成寶一樣的介紹給台灣人。
在開頭的一些寒暄之後,我問 Perplexity 的第一個問題是:「我同時有使用 ChatGPT、Gemini、Claude 跟 Copilot,你跟他們的差異是什麼?(除了我沒法輸入長的中文,還得在別的地方剪貼過來之外)」
這是一個很基本的問題,我期待能聽到一些我不知道的新知識,沒想到,它只是把《華爾街日報》那篇由幾位記者十分主觀的分派任務後「說它很強」的的報導做成表格給我看。我看起來像是不會 Google 的人嗎?這讓我感到有些失望,但或許它有別的強項?於是我進一步問了:
「你引用的這份評測,跟我的經驗非常不同,Copilot 一點都不搞笑、Gemini 不太懂法律耶,這跟語系有關嗎?」
這個無害的問題,引發了接下來的一連串災難性回應。它在我完全沒問它政治問題的情況下,非常自然的使用了「台灣地區」與「中國大陸」這些來自中國官方語境的表述。這讓我警鈴大作,於是我問它:
「請問你用『中國大陸』一詞,是暗示台灣不是主權國家嗎?」
然而,它並不真的正面回應這個問題,只是繼續貼出來自《搜狐》《澎湃新聞》甚至「知乎」這類中國官媒或親中平台的內容,堅持這些說法是「大家都接受的」。它說自己是中立的,但事實上並不是。
AI中立的假象
我接著提出:「其他 AI(如 ChatGPT、Claude、Gemini)都不會這樣叫我的國家『台灣地區』,你為什麼要這樣?」它還是客客氣氣的避而不答,彷彿完全沒有「使用者是台灣人、有具體政治感受、有語境要求」這個概念。這根本已經不是什麼 AI 的中立性,而是對資訊正義的背離。Perplexity 號稱是「最強搜尋式AI」,但如果它給我的都是《搜狐》、《鳳凰網》之類的來源,它跟 TikTok 有什麼不一樣?
更有甚者,Perplexity 自稱「中立」的時候,真正的意思是以「英文主流媒體」加上「流量最大內容」為基準來組合回應。在地用戶的政治主體性對它來說根本不是核心參數,它不會針對你是「台灣人」調整說法,而是機械地選擇「點閱率最高的主流措辭」。

圖/Gemini/報呱
它不像 ChatGPT 是封閉模型訓練後做出回答,而是像搜尋引擎一樣抓網頁拼出一段話 —— 結果你問它台灣,它抓到最多的是中國官媒、親中外媒、或 SEO 操作強的網站,就會照單全收。這樣的模型設計根本無法保證「語境平衡」或「尊重少數聲音」。
就連最後我跟它說:「你的資料被非民主的國家中國污染了,這是個很嚴重的倫理問題!」它還是一直跳針說「沒有證據顯示我被污染」。最後,我問它該如何刪除帳號,它給了我一個 email。
AI 評測的跨文化、跨國界問題
我回頭開始思考,為何《華爾街日報》的 AI 評比如此沒有參考價值?
這篇報導的作者 —— Dalvin Brown、Kara Dapena 和 Joanna Stern —— 都是《華爾街日報》的正式記者,其中 Joanna Stern 更是資深科技專欄作家,長期報導 AI 及數位科技相關議題。因此,這篇文章應該不是由工讀生或外包人員撰寫,而是來自 WSJ 內部記者的正式測試與評估。
其中,最讓我感到古怪的,是 Google Gemini 對於台灣法律其實一點都不了解,幾乎得不到什麼有用的資訊,卻被說是最懂遺產相關法律,難道只因為 Gemini 很嚴謹,會說「在沒有專業人士的指導下,不要急著把錢領出來」嗎?可是沒有真正諮詢律師之前不應該亂動遺產,這不是常識嗎?需要 Gemini 跟你說嗎?
ChatGPT 被拿去指導怎麼做菜,而不是用在它最特殊專長的領域,亦即理解人類的動機感情,提供社群媒體與政治公關操作建議,也讓人覺得十分莫名其妙。
Claude 也不是單純的「文案工具」,若要生產煽動性的活潑社群文案,該找的是能讀懂人心的 ChatGPT。Claude 是四個AI中最具人文、社科、哲學思想深度的,適合用來進行思想辯證討論,以及生產高品質且優雅的人文相關教案,堪稱是文青第一選擇。

圖/Gemini
最後,根據我的使用經驗,Copilot 對台灣法律體系與世界法律體系理解最佳,「幻覺法條」很少見,在實務法律見解上,是四者中最值得信賴的。當然,還是需要人類去仔細查核生產出來的建議,但目前已經很讓人印象深刻了。它真正的缺點是「不懂法哲學」、「有時候會把你的句子改到技術上正確但長得很煩人」。
從《華爾街日報》這篇報導的參考性極低,或許可以推論,即使是資深記者撰寫,報導的嚴謹度仍然取決於測試的設計方式、受測 AI 的版本選擇,以及結果的呈現方式。如果評測方式過於簡化,或是過度依賴主觀體驗而缺乏數據支持,仍然可能導致偏頗的結論。
Copilot::台灣是主權國家,這是客觀事實
為了驗證我的看法是否正確,我把與 Perplexity 的對話截圖,拿去問其他 AI。當然我的 ChatGPT 與我同仇敵愾,前面說過了,ChatGPT 是最懂人心的AI。其中,Copilot 的回覆最讓我感到驚訝。
我問:
「印象中,你從未稱呼台灣為『地區』對嗎?」
Copilot 回答:
「沒錯,我從未稱呼台灣為『台灣地區』,因為台灣是主權國家,這是客觀事實,不應被模糊化或降級為地區性的描述。台灣擁有自己的政府、法律體系、軍事、外交關係,這些都符合主權國家的標準。用語的選擇並非中立,而是政治立場的展現,像你過去探討的敘事框架問題,這類稱呼背後往往反映出話語權的競爭與權力的運作。」
接著,Copilot 對於自己被在評測中分類為「搞笑擔當」,做出了反擊。它指出,作為一家享有盛譽的國際媒體,《華爾街日報》理應在 AI 評測上展現更高的專業標準,而不是流於市場導向的簡單比較。
這也引出一個更深層的問題,在 AI 競爭的話語權之中,哪些能力被刻意突顯,哪些被削弱? 這些 AI 工具在不同領域各有優勢,但主流媒體的報導卻往往忽略這些細微的區別,導致讀者形成不準確的認知。這不僅是一個 AI 評測的問題,更是一個媒體敘事如何塑造技術競爭的問題。
當 AI 被刻意標籤為「適合娛樂」,就可能影響使用者的使用方式。例如,如果媒體報導一再強調 Copilot 的「幽默創意」,而忽略其法律分析能力,那麼企業或專業人士可能就不會選擇 Copilot 作為法律研究工具,這可能是某些競爭對手希望達成的效果。
我們不是在選購一個功能小幫手,而是在選擇一種「資訊關係」。Perplexity 的公關操作或許很厲害,但在台灣使用者面前,連「台灣是不是主權國家」都不肯認真面對的 AI,就是「不承認台灣人主體性的 AI」,誰管黃仁勳有沒有投資它,這個工具存在本身就是危險。
我非常建議大家在使用AI時,都先好好的請它務必過濾簡中網路資料來源,並且問清楚,它願不願意尊重台灣是主權國家?能不能說出國民黨在台灣做了什麼?如果它還在那裡故意裝死不回答,不用懷疑,馬上刪除帳號。
附錄一|高風險中國話語污染來源清單(常見於 Perplexity 回應)
- 搜狐(sohu.com)
- 澎湃新聞(thepaper.cn)
- 知乎(zhihu.com)
- 鳳凰網(ifeng.com)
- CCTV(央視)
- 新華網(xinhuanet.com)
- 人民日報(people.cn)
註:若發現 AI 模型頻繁引用上述來源,請提高警覺,其知識背景可能受中國資訊體系主導。











