Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

綠色算力新浪潮:全球數據中心能耗保衛戰與「每Token耗能」深度剖析



圖靈學院編輯部
2026-6-15

 

前言

 

    隨著生成式人工智慧(Generative AI)爆發式成長,數據中心已從過去的「數位蓄水池」演變成如今的「吞電巨獸」。根據國際能源署(IEA)預估,全球數據中心的耗電量將在2030年翻倍,達到近945 terawatt-hours(TWh),這幾乎等同於日本一整年的全國用電量。面對AI算力需求呈幾何級數增長,如何降低數據中心能耗(Power Usage Effectiveness, PUE),已成為科技巨頭、能源專家與各國政府的頭號難題。從微軟早期的海底測試,到近年中國在上海落成的全球首座「海風直連」水下數據中心,一場圍繞綠色算力的「能耗保衛戰」正在全球打響。


一、 海洋冷卻的商業化里程碑:上海臨港水下數據中心

 

    傳統陸地數據中心為了維持伺服器正常運作,其冷卻系統(如空調、冷卻塔)通常需要消耗總電量的25%至40%,並蒸發大量的淡水資源。為了解決這一痛點,將伺服器沉入海底、利用天然海水散熱的「水下數據中心」應運而生。

 

1. 「算電一體」的創新模式

 

    上海臨港外海約10公里處、沉入水下約10公尺的「臨港海底數據中心示範項目」,是全球首個真正實現「海上風電直連」的水下數據中心。其設計總容量達24兆瓦(MW),內部容納數千臺伺服器。與以往水下數據中心不同的是,該項目直接採用鄰近的海上風電場供電,實現了綠電與算力的無縫對接,其綠電供給率超過95%。

 

2. 能效與資源的雙重優化

 

  • 超高節能效率:臨港海域海底深處的年平均水溫約15°C,海水成為最天然的巨型散熱器。數據顯示,該系統相較於同等規模的陸上數據中心,整體節省用電量達22.8%。
  • 零淡水消耗:傳統陸上數據中心每天需消耗數十萬至數百萬加侖的淡水。水下數據中心採用「海水自然冷卻」,完全無需消耗珍貴的陸地淡水。
  • 極高的土地節約:對於土地寸土寸金的沿海經濟發達城市,水下部署成功減少了九成以上的陸地土地佔用。


二、 雙管齊下:全球數據中心降低能耗的主流做法

 

    除了走向海洋,全球數據中心在降低能耗方面,主要圍繞「硬體冷卻革新」與「能源結構轉型」兩大維度展開:

 


三、 微觀視角:解構大模型「每一Token的能耗」

 

    過去我們常用 PUE 來衡量數據中心的整體能源效率,但在 AI 時代,算力消耗的最小計費單位是 Token(文字片段或刻度)。當我們向 ChatGPT 提問、或讓 DeepSeek 生成代碼時,背後究竟消耗了多少電?

 

1. 推理階段(Inference)的能耗分化

 

    大模型在完成訓練後,用戶每次調用(即推理階段)所產生的能耗正主導著數據中心的能源版圖。根據 IEEE Spectrum 及多項獨立能源研究顯示:

  • 基礎生成式查詢(如 ChatGPT 基礎提問):每一次查詢大約消耗 0.34 瓦時(Wh) 到 2.9 瓦時(Wh) 的電量。這大約是標準 Google 網頁搜尋(約 0.3 瓦時)的 10 倍。
  • 長文本與複雜推理模型(如 OpenAI o3 / DeepSeek-R1):由於引入了「思考鏈(Chain of Thought)」機制,伺服器在輸出最終 Token 前需要進行大量的內部自我詰問。每一次推理查詢的能耗可飆升至 7 瓦時至 40 瓦時,相較於基礎模型,暴增了 20 至 100 倍。
  • 多模態生成(圖片與影片):圖像生成的能耗比純文字高出 20-40 倍;而生成一段短影片的能耗,更是純文字查詢的 1,000 至 3,000 倍。

 

2. 每 Token 能耗的數學與架構關係

 

    從微觀來看,大模型生成一個 Token 的能耗 Etoken(以瓦時或焦耳計),主要由以下公式和因素決定:

 


(其中 Pserver 為伺服器晶片在運算時的即時功率,Tthroughput 為每秒生成的 Token 數量。)

 

    為了降低每一個 Token 的物理能耗代價,晶片商與模型架構師正在進行以下技術變革:

 

1. 混合專家模型(MoE, Mixture of Experts):如 GPT-4 或 DeepSeek 架構,在生成特定 Token 時,只啟動模型中 5% 至 10% 的參數網路。這使得每 Token 的計算量直線下降,帶來 3 到 5 倍的能源節省。


2. 硬體能源效率比(FLOPS/Watt):NVIDIA(輝達)等晶片巨頭在新一代 AI 架構中,極力提升每瓦功率能處理的浮點運算次數。新晶片在生成相同 Token 時,能耗顯著低於前代產品。


四、 三大 AI 巨頭的節能策略與技術路徑比較

 

    巨頭們的節能手段主要分為三大核心層面:綠電採購架構(能源端)、晶片與硬體優化(算力端)、以及模型架構演算法(軟體端)。

 

1. Google:AI 智慧冷卻與專用晶片(TPU)的先驅

 

    Google 很早就意識到數據中心的耗能問題,並率先將深度學習引入基礎設施的維護中。

  • 24/7 全天候無碳能源(CFE):Google 不僅滿足於年度碳中和,更追求「每時每刻」都使用綠電。他們利用 AI 預測各地區電網的風力與太陽能發電量,動態將運算任務調配到當時綠電最充足的數據中心(時空負載轉移)。
  • TPU 架構的能源優勢:Google 自研的張量處理器(TPU,如最新一代 TPU v6/Trillium)專為神經網路優化。相較於通用型晶片,TPU 在執行 AI 訓練與推理時,每瓦特能效(Performance per Watt)提升了數倍。
  • DeepMind AI 節能控制:Google 將 DeepMind 的 AI 演算法導入數據中心的冷卻系統。AI 透過數千個感測器數據,每五分鐘自動調整冰水主機、風扇與泵浦,成功降低了 40% 的冷卻能耗。

 

2. Microsoft:核能轉型與前瞻冷卻技術的實踐者

 

    身為 OpenAI 最強大的後盾,微軟(Microsoft)在數據中心基礎設施的投資上最為激進。

  • 核能復興與 PPA(購電協議):為了解決 AI 數據中心 24 小時不間斷的龐大電力需求,微軟於 2024 年底與星座能源(Constellation Energy)簽署協議,推動三哩島核電廠復役。這象徵著微軟正式將「零碳核能」視為基載電力的核心。
  • 浸沒式液冷(Immersion Cooling):微軟是首家在生產環境中引入「雙相浸沒式液冷」的雲端巨頭。他們將伺服器直接浸泡在特殊的氟化液中,液體沸騰帶走熱量變成蒸氣,再冷凝回流。這種技術徹底揚棄了空調,讓冷卻能耗接近於零。
  • 早期水下探索(Project Natick):上海臨港的水下數據中心,某種程度上延伸了微軟早年「Natick 計劃」的概念。微軟證實水下數據中心的伺服器故障率僅為陸上的八分之一,為後續的水下商業化開闢了道路。

 

3. OpenAI:演算法極致精簡與 MoE 架構的推動者

 

    作為純粹的模型開發商,OpenAI 無法直接建造核電廠,但他們從軟體與模型架構端,對降低「每 Token 能耗」做出了決定性的貢獻。

  • 混合專家模型(MoE)的普及:從 GPT-4 開始,OpenAI 廣泛採用 MoE 架構。雖然模型總參數高達數兆,但當使用者輸入一個 Token 時,系統只會啟動其中一小部分「專家網路」(例如 1.8 兆參數中僅啟動 2800 億)。這使得每產生一個 Token 的實際計算量(FLOPs)和電耗下降了 70% 以上。
  • 模型蒸餾(Distillation)與量化:OpenAI 透過將大模型的知識「蒸餾」到較小的模型(如 GPT-4o mini),在保持極高智能的同時,讓推理階段的能耗呈斷崖式下跌,這極大地降低了數據中心在應對海量日常查詢時的電力負荷。


五、 巨頭節能做法綜合對比表

 

    綜合來看,這三家生成式 AI 先驅在解決能耗問題上各具特色,互為補足:

 


結論:軟硬一體化的綠色算力未來

 

    從上海臨港的「海風直連水下數據中心」,到微軟的「核能數據中心」,再到 OpenAI 的「MoE 演算法減肥」,產業界已經達成共識:單靠任何一種方法,都無法阻止 AI 成為能源黑洞。

未來的綠色算力將走向「軟硬一體化」的全面協同。一側是像微軟、Google 這樣運用海洋、核能與液冷將數據中心的 PUE 逼近 1.0 的極限;另一側則是像 OpenAI 一樣,在演算法端不斷壓榨每一個 Token 的計算效率。只有當綠色基礎設施遇上高效率的模型架構,生成式 AI 才能真正擺脫「吞電巨獸」的惡名,成為永續發展的數位生產力。

 


參考資料來源