Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

光速特徵抽取:從電子瓶頸到光學加速的突破


 

利創智能圖靈學院
科楠老師
2025-11-4

 

一、研究背景與動機

 

    在人工智慧與大量資料處理時代,特徵抽取(feature extraction)成為系統效能瓶頸之一。研究團隊指出,傳統電子元件在高頻、低延遲的應用場景,如高頻交易、即時影像識別、自主駕駛感知系統,已開始遭遇物理極限。為突破電子瓶頸,研究人員採用光學運算方式,將光的並行與高速特性導入「光學特徵抽取引擎」(optical feature extraction engine, 簡稱 OFE²)中。研究主旨為:設計可在千兆赫以上頻率、皮秒級延遲的裝置,實現高速、低延遲的特徵抽取。對於台灣而言,在 AI 加速器、智慧製造、邊緣運算應用中,「時間就是金錢、能耗就是競爭力」,此研究具有前瞻意義。若能將光學加速技術融合台灣積體光電或光晶片製程平台,產業可能爬上一段新的高度。


二、系統設計架構

 

    研究團隊由 北京清華大學(Tsinghua University)主導,提出名為 OFE² 的系統,關鍵模組包括:資料準備模組(data preparation)、光學衍射運算模組(diffraction operator)、多通道延遲與相位控制。

 

1. 資料準備模組:將輸入的高速序列數據轉化為多條同步的光通道。研究指出,傳統光纖功率分束或延遲線會引入相位漂移,難以維持高頻運作。研究團隊改為整合在片(on-chip)可調功率分束器與精密延遲線,並且配備可調相位陣列。此設計提升通道同步性與相位穩定性。

 

2. 衍射運算模組:光學波經過設計的衍射元件(diffraction operator),在空間中進行類似矩陣-向量乘法(MVM, matrix‐vector multiplication)的運算。當光從輸入通道經過時,透過相位控制引導光強度集中於特定輸出端口,即對應抽取的特徵。論文指出,這種方式可視為「輸入光場 × 衍射算子 = 輸出光場」,輸出強度變化即為特徵。

 

3. 多通道同步與波長分復用(WDM):為提升吞吐量,研究使用多通道並行處理與波長分復用技術。此方式使得多條頻道能同時處理數據,加快整體處理速率。

 

此架構有兩個亮點:一是將「前處理(資料準備)」移至光學通道並同步多通道,突破了傳統光學運算中通道不穩或延遲過大問題;二是利用衍射元件完成特徵抽取,而非電子電路執行,提供本質上的速度提升。


三、性能成果亮點

 

    根據報導與研究摘要,這項工作達成了幾項突破性指標:

 

  • 時鐘頻率達 12.5 GHz。
  • 單次 MVM 延遲低於 250.5 皮秒(ps)。
  • 吞吐量高達 250 GOPS(或更高,部分報導數字為 2.06 TOPS/W 效率)。
  • 實驗應用範圍包括影像邊緣特徵抽取、數位交易時間序列特徵處理。

 

在台灣製造 ICT 元件與 AI 雲邊緣整合應用中,這樣的速度與低延遲指標意味著:從感測器輸入到特徵輸出可接近「光速」級別。對於邊緣 AI、即時工業監控、智慧製造與資安快速判斷系統,有重大潛在價值。


四、應用案例與產業意涵

 

    研究團隊為驗證通用性,展示了數個具體應用場景:

 

  • 影像處理:OFE² 用於抽取輸入影像的邊緣特徵,生成類似「浮雕」(relief)與「刻紋」(engraving)效果的特徵圖。這些特徵輸出再交由電子 AI 模型進行分類或語義分割(semantic segmentation)時,模型所需電子參數量減少、準確率提升。
  • 時間序列與金融交易:在數位交易場景中,OFE² 處理實時價格訊號,輸出可直接轉換成買/賣決策。由於處理延遲極低,交易系統可搶先於市場做反應。

 

對於台灣而言,這代表以下可能性:

 

  • 智慧製造線上的即時缺陷偵測,可搭配這類光學引擎快速抽取特徵,再由電子 AI 判斷;
  • 金融交易/高頻演算法交易系統中,可將部分特徵抽取移至光學硬體,以降低延遲、提升反應速度;
  • 邊緣運算節點(如智慧攝影機、監控感測器)可搭配光學前處理模組,減少電子迴路負荷與功耗。

 

從產業鏈角度,若台灣能在光晶片、積體光學延遲線、可調裝置、衍射元件等環節具備技術積累,便可能承接此類新型加速器的部分設計製造。這對於提升台灣在「光電+AI硬體」產業的國際競爭力具啟示意義。


五、技術挑戰與侷限反思

 

    細讀完這篇研究後,有以下幾點提醒與思考:

 

1. 整合與製程成熟度:雖然研究報導显示為 on-chip 解決方案,但光学元件(如功率分束器、延遲線、相位陣列、衍射元件)仍有微製程與封裝挑戰。光學元件的穩定性(如溫漂、相位漂移、耦合損耗)在大規模量產中是隱憂。

 

2. 可重構性與通用性:文中強調可調相位、可重構通道的能力,但實際支持多任務(例如不同類型特徵抽取:圖像、語音、時間序列)仍待更廣範驗證。對於台灣產業界而言,專用光學加速器若缺乏靈活性,可能被電子通用加速器(如 GPU/FPGA)繼續壓制。

 

3. 系統整合、上下游瓶頸:即便抽取模塊速度飛躍,整體系統還需考慮輸入感測、資料轉化(光/電介面)、後端電子 AI 模型、資料輸出延遲等。光學加速器若孤立,整體效益可能受限。台灣若要導入,必須思考整體解決方案,而不只單一元件。

 

4. 功耗與成本效益:報導提及效率(如 TOPS/W)提升,但光學模組的製造成本、光耦合損失、封裝調校成本尚未公開大量商用數據。產業推動時需驗證其經濟性。台灣企業在導入前要做成本/效益分析。

 

5. 應用場景範圍:研究展示了兩個應用場景,但並未大量展示標準大規模 AI 任務(如大型卷積神經網路或生成模型)中整系統優勢。如需進入台灣 AI 產業生態,還需更多「端到端」案例。


六、對台灣研究與實務的建議

 

    以科楠老師角度,對台灣產學界有以下建議:

 

  • 台灣內部可建立「光學加速器+AI 特徵抽取」的研究團隊,優先聚焦具體工業場景(如製造檢測、機械視覺、邊緣感測)做原型驗證,降低應用門檻。
  • 與半導體/光電製造業鏈協作,例如光子晶片製造、延遲線設計、功率分束器製程,共同開發適用於台灣量產的光學模組。
  • 在系統整合層面,提出「光抽取模組+電子 AI 模型」的混合架構設計,並針對功耗、延遲、經濟性三指標進行量化比較。
  • 產業應關注此類技術落地門檻(如封裝、耦合、校準與可靠性)而非僅稱為「光速」噱頭。務實評估從實驗室到產線的轉化成本與時間。
  • 政策/資金層面,建議政府與產業基金設立針對「光電+AI加速器」的專項計畫,鼓勵跨校、跨產業合作,從系統原型走向產業導入。


七、總結

 

    本篇研究以光學方式重新思考特徵抽取這一 AI 系統中的關鍵步驟,並取得令人矚目的速度與低延遲突破。對台灣來說,它提供了製造、硬體、AI 整合三大領域的參考。但切記:從「突破指標」到「產業落地」仍有長路。唯有從可量產性、經濟性、系統化整合能力著手,才可能將這類前沿技術轉化為台灣在全球 AI 加速器與光電硬體競賽中的一張王牌。

 

 

參考資料

1. ScienceDaily "Breakthrough optical processor lets AI compute at the speed of light"
 

 

2.SPIE Digital Library "High-speed and low-latency optical feature extraction engine based on diffraction operators"