Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

封鎖線下的奇蹟:DeepSeek 如何在晶片制裁中突 圍與重塑全球 AI 版圖


 

圖靈學院編輯部
2026-5-15

 

一 、前言:一場震驚矽谷的「低成本」革命


    2025    年初,當全球人工智慧(AI)競爭正處於算力軍備競賽的白熱化階段時,一家來自中國大陸的初創公司 DeepSeek(深度求索) 釋出的 R1 模型,如同在平靜的水面上投下了一顆深水炸彈。這顆炸彈不僅震動了 OpenAI 、Anthropic等矽谷巨頭的估值,更直接挑戰了美國商務部試圖透過晶片禁令構築的「科技圍 牆」。根據《紐約時報》的深度報導,DeepSeek  的成功並非依賴於無限的算力堆疊,而是在極端資源受限的環 境下,透過極致的演算法優化與系統架構創新實現的突破。這標誌著全球 AI發展進入了一個新的分水 嶺:從「算力為王」轉向「效率至上」。

 

二、 禁令下的博弈:H800 與「受阻」的創新


    美國對華半導體管制的初衷是明確的:透過切斷高階  GPU (如 Nvidia H100)的供應,減緩中國大陸在尖端 AI 模型上的研發進度。然而,DeepSeek 的案例卻揭示了一個尷尬的現實,制裁反而成為了中國大陸企業追求「極致效率」的催化劑。


1. 算力鴻溝的填補

 

    報導指出,DeepSeek V3 與 R1 模型主要是在 Nvidia H800,這款專為中國大陸市場設計、被閹割了互連頻寬的晶片上訓練完成的。在矽谷的標準邏輯中,這種晶片由於資料交換速度慢,很難用於訓練兆級參數的大模型。但 DeepSeek 的團隊研發了獨特的並行計算架構,巧妙地避開了頻寬瓶頸,讓「二流晶片」 跑出了接近「一流效能」的成果。


2. 庫存與黑市的灰色地帶

 

    除了技術上的突圍,報導也提及了算力資源的來源多樣性。包括母公司幻方量化(High-Flyer)在禁令前囤積的 A100 晶片,以及透過第三方國家流入的零散資源。這種多樣化的資源組合,支撐了 DeepSeek在早期階段的實驗需求。

 

三、 核心技術分析:為何 DeepSeek 能「以小博大」?


    DeepSeek  的成功並非偶然,而是源於其在演算法層面的深度創新。這也是《紐約時報》與眾多AI專家最為關注的核心點。


「DeepSeek 證明了:如果你的數學夠好,你就不需要那麼多晶片。」 —— 這句話成了對該 公司技術實力的最佳註腳。

其核心技術貢獻包括:

• 混合專家模型 (MoE) 的極致應用: 透過精細化的負載平衡策略,DeepSeek 讓模型在推理 時僅啟動極小部分的參數,大幅降低了計算成本。
• 多標記預測與 MLA 架構: 這些創新顯著減少了內存占用,提升了在頻寬受限設備上的運行 效率。
• 強化學習 (RL)  的新型路徑:  R1 模型展示了如何不依賴昂貴的人類反饋資料,而是透過純 粹的強化學習引發模型的「思考」能力。

 

四、 產業衝擊:矽谷巨頭的集體焦慮


    DeepSeek 的出現直接戳破了「大模型必須耗資百億美元」的泡沫。當 OpenAI 需要投入數萬枚 H100 、 消耗數十億美元來訓練一個模型時,DeepSeek 聲稱其訓練成本僅約 500 萬美元。
這種成本結構的斷層,引發了全球科技股的劇烈波動。Nvidia 的股價一度因市場擔憂「算力需求可能不如預期」而受挫,而微軟、Google   等雲端運算巨頭也開始重新審視其昂貴的基礎設施戰略。這不僅僅是中 國與美國的對抗,更是「開源」與「閉源」、「效率」與「暴力美學」的路線之爭。

 

五、 政策反思:美國晶片出口管制是否失敗?


    這是《紐約時報》報導中極具爭議性的話題。支持者認為制裁依然有效,因為   DeepSeek   雖然取得了成 就,但仍落後於美國最領先的模型(如 GPT-4o 或 o1)約半年到一年的時間。
然而,反對者則指出,制裁並未能阻止中國大陸具備「領先群」的競爭力,反而推動了中國大陸 AI 自主化進程:

• 硬體自主化加速:DeepSeek 的成功讓中國大陸意識到演算法優化的重要性,但也讓更多資源 投向華為昇騰等國產 AI 晶片。
• 全球人才流向: DeepSeek 證明了在北京一樣能做出改變世界的 AI,這有助於吸引與留住 頂尖華人工程師。

 

六、 未來展望:中美 AI 競賽的下半場


    展望未來,DeepSeek 引發的連鎖反應將在三個層面展開:

 

1. 標準之爭

    DeepSeek 堅持開源路線,正迅速吸引全球開發者進入其生態系統。這將直接與 Meta 的 Llama 競爭,爭 奪AI開發的話語權。


2. 能源與環境的永續性

 

    當全世界都在擔憂AI耗電量時,DeepSeek 提供的「低能耗模型」路徑,可能成為開發中國大陸家甚至是歐 洲市場的首選。

 

3. 地緣政治的再平衡

 

    美國可能會進一步收緊制裁,但 DeepSeek 的案例已經向世界證明,技術的擴散與演進是難以被行政命令 完全阻隔的。

 

七、 結語

 

    DeepSeek  的故事並非僅僅是關於一個模型的勝出,它是一則關於逆境、創新與典範轉移的當代寓言。它 告訴我們,在科技競爭的戰場上,雖然硬體設施是重要的根基,但人類的智慧與對效率的不懈追求,始終  是翻越圍牆最強大的力量。對於中國大陸半導體與AI產業而言,這是一個里程碑;對於全球科技觀察者而言,這則是一個提醒:未來的     AI,未必只屬於算力最雄厚的人,而屬於最懂得如何優化每一焦耳能量的人。

 

 

新聞來源
The New York Times:China Seeks A.I. Independence, Weakening Trump’s Leverage