魔高一丈 買不到輝達AI晶片?中國租用境外輝達晶片伺服器

NVIDIA H100 Tensor 核心 GPU。H100 所結合的技術創新,可加速大型語言模型速度,比前一代 A100 快上 30 倍,提供領先業界的對話式人工智慧。(圖/NVIDIA)

美國限制輝達(Nvidia)的高階人工智慧(下稱 AI)晶片售往中國。但有充分發揮效果嗎?目前已知的是,仍有化整為零的地下網絡,協助中國收購輝達的晶片。根據《華爾街日報》(The Wall Street Journal)今(2024)年 8 月 26 日報導,更提到現在中國的 AI 廠商找到的新方案是,透過境外的合作者,間接使用佈建在他國採用輝達 AI 晶片伺服器的運算能力。

相關報導:美國再出手限制NVIDIA和AMD高階運算晶片出口到中國

美國限制向中國出口先進晶片的規範並沒有完全阻止高階晶片流入中國,《華爾街日報》7 月曾報導,由 70 多家賣家組成的地下網絡聲稱每月會收到數十個高階 AI 晶片。

例如一名中國學生曾在 2023 年 11 月將 6 個輝達 A100 GPU 從新加坡帶回中國,而每個晶片的報酬是 100 美元。

延伸閱讀:華為新手機宣稱用中國製晶片 實際上還有海外走私貨?

中國遠距租用運算能力 道高一尺,魔高一丈

但是,前比特幣礦工 Derek Aw 向《華爾街日報》透露,他說服了美國和杜拜的投資者幫助購買採用輝達 H100 晶片的 AI 伺服器。

6 月,Derek Aw 將 300 多台伺服器放入澳洲布里斯本的資料中心,三週後,該中心就向一家位在北京的公司提供 AI 模型的算力。Derek Aw 説:「有需求。有利潤。當然就會有人提供服務。」

遠距離租用運算能力並不是新鮮事,許多跨國公司都有在用 Google 雲端、微軟 Azure 和亞馬遜網路的遠端服務。熟悉美國制裁的律師表示,有計算能力需求的買家和賣家以及他們的中間人沒有違法。

亞馬遜雲端服務AWS自2012年開始每年12月初都會在美國拉斯維加斯舉辦全球年度最大雲端科技發表盛會「re:Invent」。
(圖/路透社/中央社)

華盛頓目前的限制目標是先進晶片、設備和技術,但雲端公司表示,出口規則並未限制中國公司或其外國子公司存取有使用輝達晶片的美國雲端服務

在 Derek Aw 的平台中,計費和支付方式均是高度匿名性。買家和賣家雙方僅透過一串字母和數字作身份識別,買方用加密貨幣付款。加密貨幣的匿名性也擴展到合約本身,合約與付款都有使用區塊鏈的數位記錄保存技術。Derek Aw 表示,連他自己也可能不知道買家的真實身分。

此外,中國的公司還會多設一層防火牆,透過新加坡或其他地方的子公司進行交易。Derek Aw 還說:「自去年年底以來,我們平台上的中國客戶數量大幅增加,我經常被問到我們是否有輝達的晶片。」

中國利用去中心化 GPU 在上海訓練AI模型

像 Derek Aw 這樣的平台在過去兩年中會出現是因為挖掘加密貨幣退燒,因此挖礦者釋放一些以前挖比特幣等數位貨幣的算力。這些平台會聚集分散在全球各地的運算能力並出租給 AI 開發人員。

出售分散算力的服務稱為去中心化 GPU 模型(decentralized GPU model),GPU 是繪圖處理器。輝達的 GPU 廣泛用於 AI 運算。相關的營運商表示,自 2022 年美國限制向中國出售先進晶片以來,越來越多的中國客戶開始轉向去中心化平台來獲取算力。

過去在上海一家 AI 新創公司工作的 Joseph Tse 表示,他的前雇主在發現無法從亞馬遜網路服務租用運算能力後,就轉向去租用某家去中心化 GPU 模型服務。該服務在加州的一個數據中心有 400 多台伺服器,配備 Nvidia 的 H100 晶片,能幫助這家上海公司訓練 AI 模型。

不過,Joseph Tse 指出,這個服務雖然跟亞馬遜或 Google 等公司提供的雲端運算沒有太大區別,但風險高,因為這種區塊鏈系統可能存在程式碼缺陷和資料被盜的風險。他說:「區塊鏈確實保護用戶的隱私,但如果因此出現問題,很難追究責任,但我們沒有太多選擇。為了生存,我們不得不嘗試一切可能性。」

io.net 是一家去中心化 GPU 模型供應商,擁有超過 40,000 個晶片,這家公司在用戶指南中宣傳稱,可以讓用戶在 90 秒內獲得算力開始工作。

AI雲端運算 配合中國需求 建立更大運算叢集

在今年 6 月於新加坡舉行的 AI 產業博覽會上,至少有三家去中心化 GPU 公司宣傳可以讓用戶在全球不受限制地使用經濟實惠輝達運算能力的平台。所有業者都說他們有來自中國的客戶。

新加坡在6月5、6日於濱海灣金沙舉行了首次亞洲最大AI 聚會「SuperAI」。去中心化 GPU 租借平台 io.net是本次活動贊助商。
(圖/X@superai_conf)

新創公司和個人開發者使用去中心化平台來建立和運行小型 AI 模型,並不需要超級電腦能力或即時回饋。所以,這種去中心化網路服務通常無法訓練大型 AI 模型,例如像 ChatGPT 的模型需要數千個晶片才能在系統內快速傳輸資料。

這就是為什麼 Derek Aw 等供應商要建立更大的處理器叢集(clusters),以符合特定客戶的需求。

Edge Matrix Computing 成立於 2022 年,是一家致力於打造更大晶片叢集的公司,已在去中心化網路中串了 3,000 多個 GPU,其中也包括輝達晶片。

Edge Matrix Computing 表示,正在徵求投資者籌資購買輝達 H100 晶片,每個這種等級的晶片價格,相當於一輛凱迪拉克豪華轎車(約新台幣上百萬至數百萬元)。但據稱,大量購買運算能力的用戶每小時使用 H100 的費用不到 2 美元。

NVIDIA H100 Tensor 核心 GPU。據 Nvidia 在網站上的說明,H100 所結合的技術創新,可加速大型語言模型速度,比前一代 A100 快上 30 倍,提供領先業界的對話式人工智慧。
(圖/NVIDIA)

中資以新加坡公司採購 先進微晶片穩定流入中國

整體而言,雖然高階的 AI 晶片受到美國出口管制,但中國用戶卻可以透過類似 Edge MatrixComputing 或 Derek Aw 提供的服務使用到高階 AI 晶片的算力。

路易斯安那州共和黨參議員甘迺迪(John Kennedy)在 7 月的參議院委員會聽證會稱,商務部目前的做法讓中國用戶還是能鑽限制條款的漏洞。他寫信給商務部長說:「看來先進的微晶片仍在持續穩定地流入中國。這種流入必須停止。」商務部負責出口管理的助理部長肯德勒(Thea Rozman Kendler)則表示,正在密切追蹤非法採購網絡。

但與此同時,Derek Aw 正從沙烏地阿拉伯和韓國的投資者那裡籌集更多資金,計劃為另一家中資的新加坡公司組輝達最新 Blackwell 晶片的伺服器。Derek Aw 説:「沒人違反出口管制,從法律上來看,他們是新加坡公司。」

延伸閱讀:
美媒:中國低估半導體複雜性 正輸掉這場晶片戰
中國政策將成美國總統選舉攻防議題 美中晶片戰將越演越烈?
美國再收緊對中國出口AI晶片 中國反擊限制石墨出口
經濟安全就是國家安全》李淳:別讓敵人撿到槍!台灣首重經濟不可或缺性

參考新聞連結:
2024/08/26 The Wall Street Journal China’s AI Engineers Are Secretly Accessing Banned Nvidia Chips
2024/07/02 The Wall Street Journal The Underground Network Sneaking Nvidia Chips Into China

Tagged: