圖靈學院內的文章包含三大主題:ESG浄零實驗室、AI實驗室及精實管理實驗室,我們會不定期分享相關主題之文章,也歡迎並對前述主題有興趣的學員投稿分享您的見解  (我要投稿)

圖靈學院創辦人 科楠老師的願景

綠色算力新浪潮:全球數據中心能耗保衛戰與「每Token耗能」深度剖析



圖靈學院編輯部
2026-6-15

 

前言

 

    隨著生成式人工智慧(Generative AI)爆發式成長,數據中心已從過去的「數位蓄水池」演變成如今的「吞電巨獸」。根據國際能源署(IEA)預估,全球數據中心的耗電量將在2030年翻倍,達到近945 terawatt-hours(TWh),這幾乎等同於日本一整年的全國用電量。面對AI算力需求呈幾何級數增長,如何降低數據中心能耗(Power Usage Effectiveness, PUE),已成為科技巨頭、能源專家與各國政府的頭號難題。從微軟早期的海底測試,到近年中國在上海落成的全球首座「海風直連」水下數據中心,一場圍繞綠色算力的「能耗保衛戰」正在全球打響。


一、 海洋冷卻的商業化里程碑:上海臨港水下數據中心

 

    傳統陸地數據中心為了維持伺服器正常運作,其冷卻系統(如空調、冷卻塔)通常需要消耗總電量的25%至40%,並蒸發大量的淡水資源。為了解決這一痛點,將伺服器沉入海底、利用天然海水散熱的「水下數據中心」應運而生。

 

1. 「算電一體」的創新模式

 

    上海臨港外海約10公里處、沉入水下約10公尺的「臨港海底數據中心示範項目」,是全球首個真正實現「海上風電直連」的水下數據中心。其設計總容量達24兆瓦(MW),內部容納數千臺伺服器。與以往水下數據中心不同的是,該項目直接採用鄰近的海上風電場供電,實現了綠電與算力的無縫對接,其綠電供給率超過95%。

 

2. 能效與資源的雙重優化

 

  • 超高節能效率:臨港海域海底深處的年平均水溫約15°C,海水成為最天然的巨型散熱器。數據顯示,該系統相較於同等規模的陸上數據中心,整體節省用電量達22.8%。
  • 零淡水消耗:傳統陸上數據中心每天需消耗數十萬至數百萬加侖的淡水。水下數據中心採用「海水自然冷卻」,完全無需消耗珍貴的陸地淡水。
  • 極高的土地節約:對於土地寸土寸金的沿海經濟發達城市,水下部署成功減少了九成以上的陸地土地佔用。


二、 雙管齊下:全球數據中心降低能耗的主流做法

 

    除了走向海洋,全球數據中心在降低能耗方面,主要圍繞「硬體冷卻革新」與「能源結構轉型」兩大維度展開:

 


三、 微觀視角:解構大模型「每一Token的能耗」

 

    過去我們常用 PUE 來衡量數據中心的整體能源效率,但在 AI 時代,算力消耗的最小計費單位是 Token(文字片段或刻度)。當我們向 ChatGPT 提問、或讓 DeepSeek 生成代碼時,背後究竟消耗了多少電?

 

1. 推理階段(Inference)的能耗分化

 

    大模型在完成訓練後,用戶每次調用(即推理階段)所產生的能耗正主導著數據中心的能源版圖。根據 IEEE Spectrum 及多項獨立能源研究顯示:

  • 基礎生成式查詢(如 ChatGPT 基礎提問):每一次查詢大約消耗 0.34 瓦時(Wh) 到 2.9 瓦時(Wh) 的電量。這大約是標準 Google 網頁搜尋(約 0.3 瓦時)的 10 倍。
  • 長文本與複雜推理模型(如 OpenAI o3 / DeepSeek-R1):由於引入了「思考鏈(Chain of Thought)」機制,伺服器在輸出最終 Token 前需要進行大量的內部自我詰問。每一次推理查詢的能耗可飆升至 7 瓦時至 40 瓦時,相較於基礎模型,暴增了 20 至 100 倍。
  • 多模態生成(圖片與影片):圖像生成的能耗比純文字高出 20-40 倍;而生成一段短影片的能耗,更是純文字查詢的 1,000 至 3,000 倍。

 

2. 每 Token 能耗的數學與架構關係

 

    從微觀來看,大模型生成一個 Token 的能耗 Etoken(以瓦時或焦耳計),主要由以下公式和因素決定:

 


(其中 Pserver 為伺服器晶片在運算時的即時功率,Tthroughput 為每秒生成的 Token 數量。)

 

    為了降低每一個 Token 的物理能耗代價,晶片商與模型架構師正在進行以下技術變革:

 

1. 混合專家模型(MoE, Mixture of Experts):如 GPT-4 或 DeepSeek 架構,在生成特定 Token 時,只啟動模型中 5% 至 10% 的參數網路。這使得每 Token 的計算量直線下降,帶來 3 到 5 倍的能源節省。


2. 硬體能源效率比(FLOPS/Watt):NVIDIA(輝達)等晶片巨頭在新一代 AI 架構中,極力提升每瓦功率能處理的浮點運算次數。新晶片在生成相同 Token 時,能耗顯著低於前代產品。


四、 三大 AI 巨頭的節能策略與技術路徑比較

 

    巨頭們的節能手段主要分為三大核心層面:綠電採購架構(能源端)、晶片與硬體優化(算力端)、以及模型架構演算法(軟體端)。

 

1. Google:AI 智慧冷卻與專用晶片(TPU)的先驅

 

    Google 很早就意識到數據中心的耗能問題,並率先將深度學習引入基礎設施的維護中。

  • 24/7 全天候無碳能源(CFE):Google 不僅滿足於年度碳中和,更追求「每時每刻」都使用綠電。他們利用 AI 預測各地區電網的風力與太陽能發電量,動態將運算任務調配到當時綠電最充足的數據中心(時空負載轉移)。
  • TPU 架構的能源優勢:Google 自研的張量處理器(TPU,如最新一代 TPU v6/Trillium)專為神經網路優化。相較於通用型晶片,TPU 在執行 AI 訓練與推理時,每瓦特能效(Performance per Watt)提升了數倍。
  • DeepMind AI 節能控制:Google 將 DeepMind 的 AI 演算法導入數據中心的冷卻系統。AI 透過數千個感測器數據,每五分鐘自動調整冰水主機、風扇與泵浦,成功降低了 40% 的冷卻能耗。

 

2. Microsoft:核能轉型與前瞻冷卻技術的實踐者

 

    身為 OpenAI 最強大的後盾,微軟(Microsoft)在數據中心基礎設施的投資上最為激進。

  • 核能復興與 PPA(購電協議):為了解決 AI 數據中心 24 小時不間斷的龐大電力需求,微軟於 2024 年底與星座能源(Constellation Energy)簽署協議,推動三哩島核電廠復役。這象徵著微軟正式將「零碳核能」視為基載電力的核心。
  • 浸沒式液冷(Immersion Cooling):微軟是首家在生產環境中引入「雙相浸沒式液冷」的雲端巨頭。他們將伺服器直接浸泡在特殊的氟化液中,液體沸騰帶走熱量變成蒸氣,再冷凝回流。這種技術徹底揚棄了空調,讓冷卻能耗接近於零。
  • 早期水下探索(Project Natick):上海臨港的水下數據中心,某種程度上延伸了微軟早年「Natick 計劃」的概念。微軟證實水下數據中心的伺服器故障率僅為陸上的八分之一,為後續的水下商業化開闢了道路。

 

3. OpenAI:演算法極致精簡與 MoE 架構的推動者

 

    作為純粹的模型開發商,OpenAI 無法直接建造核電廠,但他們從軟體與模型架構端,對降低「每 Token 能耗」做出了決定性的貢獻。

  • 混合專家模型(MoE)的普及:從 GPT-4 開始,OpenAI 廣泛採用 MoE 架構。雖然模型總參數高達數兆,但當使用者輸入一個 Token 時,系統只會啟動其中一小部分「專家網路」(例如 1.8 兆參數中僅啟動 2800 億)。這使得每產生一個 Token 的實際計算量(FLOPs)和電耗下降了 70% 以上。
  • 模型蒸餾(Distillation)與量化:OpenAI 透過將大模型的知識「蒸餾」到較小的模型(如 GPT-4o mini),在保持極高智能的同時,讓推理階段的能耗呈斷崖式下跌,這極大地降低了數據中心在應對海量日常查詢時的電力負荷。


五、 巨頭節能做法綜合對比表

 

    綜合來看,這三家生成式 AI 先驅在解決能耗問題上各具特色,互為補足:

 


結論:軟硬一體化的綠色算力未來

 

    從上海臨港的「海風直連水下數據中心」,到微軟的「核能數據中心」,再到 OpenAI 的「MoE 演算法減肥」,產業界已經達成共識:單靠任何一種方法,都無法阻止 AI 成為能源黑洞。

未來的綠色算力將走向「軟硬一體化」的全面協同。一側是像微軟、Google 這樣運用海洋、核能與液冷將數據中心的 PUE 逼近 1.0 的極限;另一側則是像 OpenAI 一樣,在演算法端不斷壓榨每一個 Token 的計算效率。只有當綠色基礎設施遇上高效率的模型架構,生成式 AI 才能真正擺脫「吞電巨獸」的惡名,成為永續發展的數位生產力。

 


參考資料來源