Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

詹姆斯韋伯太空望遠鏡突破影像極限:AI驅動的深空影像重建技術


 

圖靈學院
科楠老師
2025-10-31

 

太空觀測遇上機器學習的革命性突破

 

    詹姆斯韋伯太空望遠鏡(JWST)升空三年後,科學家面臨一個棘手問題。這台造價百億美元的設備搭載的孔徑遮罩干涉儀(AMI)無法發揮預期性能。探測器的非線性誤差嚴重限制了觀測能力。傳統校正方法束手無策。來自雪梨大學、麥覺理大學和約翰霍普金斯大學的研究團隊提出解決方案。他們開發了名為"dorito"的影像重建系統。這套工具結合自動微分技術與神經網絡模型。結果令人驚艷。


探測器的致命缺陷

 

    AMI使用HAWAII-2RG CMOS探測器。這款設備有個嚴重問題:電荷會從較亮的像素擴散到鄰近像素。科學界稱之為「Brighter-Fatter Effect」(BFE)。明亮特徵在影像中變得更寬更胖。這個現象無法用傳統傅立葉平面校正方法處理。AMI的影像平面採樣率剛好達到奈奎斯特標準。探測器對電荷遷移特別敏感。早期分析顯示,所有現存的數據處理管道都遇到相同瓶頸。AMICAL、SamPy、SAMPip等工具無法突破感度極限。搜尋暗淡伴星的任務嚴重受阻。

 

 

圖1:Brighter-Fatter Effect效應示意圖對比

 

端到端的可微分建模

 

    研究團隊的策略徹底不同。他們建立完整的儀器前向模型。這個模型涵蓋光學系統到探測器的每個環節。關鍵技術是使用Jax程式庫。Jax提供自動微分功能。系統可以計算模型中每個參數對最終影像的影響。這讓梯度下降法等優化演算法能夠有效運作。團隊開發的amigo基礎模型整合了光學模型與「有效探測器模型」。後者是個神經網路。它學習模擬BFE等探測器效應。研究人員用校準數據集訓練這個網路。訓練完成後,基礎模型的遮罩測量參數與電子特性參數固定不變。科學家只需調整鏡面形狀參數與天體物理場景參數。系統直接對像素級斜坡數據建模。這種方法繞過傅立葉平面校正的難題。

 

兩種影像重建策略

 

    dorito系統提供兩種方法。

 

方法一:影像平面直接建模

 

    系統將解析後的光源建模為與光源分布陣列的卷積。整個擬合過程在影像平面進行。完全不使用複數可見度。

擬合參數包括:


- 每次曝光的位置
- 每次曝光的通量
- 每個目標每個濾鏡的光譜
- 科學目標的對數分布
- 校準星的鏡面像差

 

這個方法在探測器非線性主導誤差來源時表現最好。

 

方法二:DISCO不變量方法

 

    團隊開發了「延遲不敏感校準觀測量子空間」(DISCO)方法。這延伸了核相位理論。AMI的遮罩孔徑相對於分離距離來說相當大。系統需要處理低空間頻率資訊。遮罩不完全共軛於望遠鏡瞳孔平面。需要小量菲涅爾散焦。傳統閉合相位不再保持不變性。DISCO方法產生核算子。這個算子將受波前誤差影響的可見度模式清零。系統追蹤參數的協方差。重新對角化後得到統計獨立的觀測量。這些觀測量對波前誤差、近場效應和光譜校準誤差都具有韌性。

 

 

圖2:Method 1影像平面重建流程圖(Max Charles et al.,2025)

 

 


圖3:Method 2 DISCO重建流程圖(Max Charles et al.,2025)


正則化技術的選擇

 

    影像重建是個病態反問題。許多不同影像都能同樣良好地擬合數據。正則化技術限縮解空間。

 

dorito預設實作幾種正則化方法:

 

最大熵正則化


    追求最大夏農熵的影像。這類影像包含最少組態資訊。任何結構都需要數據證據支持。

 

總變差正則化


    使用空間梯度的L1範數。這種方法傾向產生通量高原區域。邊緣保持清晰。過度正則化會產生卡通化特徵。

 

二次變差正則化


    使用空間梯度的L2範數。這平滑影像。相鄰像素的值差異受到懲罰。

 

研究團隊使用L曲線方法選擇超參數。對於不同的λ值優化影像。繪製對數似然項對對數先驗項的圖。最佳λ值對應曲線的肘部。

 

 

圖4:Io影像的L曲線圖及不同正則化參數的重建結果(Max Charles et al.,2025)

 

三個標竿案例

 

NGC 1068:活躍星系核心的精細結構

 

    NGC 1068是典型的第二型賽佛特星系。距離地球約14百萬秒差距。中心有個質量約三千萬太陽質量的超大質量黑洞。研究團隊使用方法一加總變差正則化重建影像。觀測使用F380M、F430M、F480M三個濾鏡。採用五點次像素抖動模式。重建影像顯示中心亮核東南方約0.1角秒處有延伸結構。大型雙筒望遠鏡干涉儀(LBTI)在8.7微米的影像高度吻合。AMI在較短波長揭露更多細節。明亮區域位於超大質量黑洞投影距離約10秒差距的位置。這裡外流與塵埃環境相互作用。塵埃昇華半徑約0.4秒差距。10秒差距處的塵埃能夠存活並再處理輻射。外流速度約每秒一千公里。熱點在10秒差距處意味活躍星系核運作至少一萬年。100秒差距內的過密度結構顯示活動持續約十萬年。

 

Io:火山月球的旋轉觀測

 

    Io是木星最內側的伽利略衛星。極端潮汐力造就太陽系最活躍的火山活動。表面永遠有火山噴發。紅外光譜特別明亮。2022年8月1日,AMI觀測Io和校準星HD 2236。僅使用F430M濾鏡。五個次像素抖動位置。每個位置45組、100次積分。研究團隊將每次曝光視為獨立的非抖動影像。這樣能解析時間演化。Io每8.55分鐘自轉1.21度。這個旋轉可以分辨。

 

重建影像偵測五個已知火山特徵:


1. Seth Patera
2. P197
3. Masubi
4. Leizi Fluctus  
5. Amirani

 

這些熱點在預期位置出現。月球邊緣清晰可辨。整個觀測序列顯示表面旋轉。團隊沒有觀察到Seth Patera周圍的擴散發射。Keck觀測和先前AMI分析都看到這個特徵。研究人員認為那可能是未校正的BFE或PSF結構。

 

 

圖5:Io的五個時間點重建影像序列,顯示旋轉效果(Max Charles et al.,2025)

 

WR 137:碰撞風雙星的考驗

 

    WR 137是碰撞風雙星系統。富碳沃夫-拉葉星與O9型伴星組成。軌道相位調節碰撞風交互作用強度。產生約13年週期的紅外光變。塵埃隨高速風外流。形成螺旋形態的膨脹結構。這類「風車」系統在近紅外和中紅外都很亮。2022年三次觀測期間發生鏡面傾斜事件。第一次觀測幾乎完成所有科學數據後,才輪到校準星。鏡面突然移動。校準星遭遇的波前與科學目標不同。研究團隊使用方法二加最大熵正則化處理這個數據集。僅用傾斜事件後的第二和第三觀測期(7月15日和8月8日)聯合擬合。重建影像顯示沿東南-西北方向的條紋。所有早期重建都看到這個特徵。長度和方向符合側向觀看的碰撞風雙星風車星雲模型。為測試DISCO對波前誤差的韌性,團隊也重建傾斜事件前的7月13日數據。這些科學曝光用7月15日的校準曝光校正。兩者波前顯著不同。方法一產生的影像充滿光譜相依的非物理校準假影。方法二產生的影像相對乾淨。視覺上與另兩個觀測期的影像相似。DISCO不變量確實對波前誤差具有韌性。

 

 

圖6:WR 137在不同方法下的重建影像對比(Max Charles et al.,2025)

 

GPU加速與自動微分的威力

 

    整個系統建構在Jax上。Jax是Google開發的數值計算程式庫。核心優勢有三:

 

1. 自動微分:系統自動計算損失函數對所有參數的梯度。不需要手動推導。這讓複雜模型的優化變得可行。

 

2. GPU加速:計算在圖形處理器上執行。數百萬或數十億參數的模型訓練時間大幅縮短。相對平價的硬體就能運行。

 

3. 即時編譯:Jax使用XLA編譯器。程式碼執行前優化。運算效率接近手寫C++或Fortran。

 

研究團隊還使用PyTorch生態系的MPoL作為靈感來源。MPoL是處理電波/次毫米波干涉數據的正則化最大似然影像重建框架。已成功應用於ALMA連續譜觀測的原行星盤。

 

未來方向與建議

 

    研究團隊提出幾點觀測策略建議:

 

1.增加組數


    在保持最大井深低於約三萬計數的前提下,增加斜坡採樣的組數。這改善訊噪比。

 

2.類似亮度的校準星


    校準星和科學目標應該有相似亮度。觀測到相似井深。這確保BFE特性一致。

 

3.多點次像素抖動


    使用盡可能多的次像素抖動位置。這更好地分離探測器效應與天體物理資訊。許多AMI觀測試圖讓目標保持在相同次像素位置。研究團隊認為這是錯誤策略。

 

4.免校準星干涉術的可能性


    JWST進行頻繁的波前感測測量。每48小時漂移小於10奈米均方根。除了傾斜事件外,任何時刻對波前的了解幾乎與點源參考校準一樣好。這開啟免校準星干涉術的可能性。CAL-SCI或CAL-SCI-CAL觀測序列可能不再必要。時間開銷和約束條件大幅降低。團隊建議對這個選項進行基準測試。

 

5.不完全清零波前模式


    DISCO方法將所有受波前誤差影響的可見度線性組合清零。這很極端。對複雜場景的影像重建來說,損失太多傅立葉模式。如果適當傳播校準星或例行波前感測的波前誤差,可能避免完全清零這些模式。同時保留自我校準的好處。

 

機器學習的下一步

 

    正則化最大似然法是天文學影像重建的標準方法。表現良好。但遠非最現代或最精密的途徑。像素基底在這裡表現不錯。沒有理由認為它是最優的。小波基底正在dorito中實作。機器學習提供許多改進途徑:

 

分數基底的先驗與似然


    使用擴散模型或流模型學習影像分布。生成式AI技術可能大幅改善重建品質。

 

深度影像先驗


    神經網路本身作為影像表示。不需要預訓練。網路結構隱含提供正則化。

 

資訊場論


    貝葉斯框架的擴展。處理連續場的不確定性。

 

自編碼器


    Io的AMI工作已展示這個方向的潛力。編碼器學習緊湊的影像表示。解碼器重建完整影像。這些方法在解析接近內工作角的光源時特別有影響力。也能推廣到日冕儀數據的可微分渲染。那裡問題更非線性。接近內工作角處場景扭曲更嚴重。

 

開源生態系的力量

 

    所有程式碼和數據公開可取得。amigo模型和管線在GitHub託管。dorito模型也在GitHub上。附帶本文結果的範例筆記本。

數據來自Barbara A. Mikulski太空望遠鏡檔案館(MAST)。研究團隊鼓勵其他研究者改編和應用這些工具到自己的干涉數據集。這展示現代科學研究的新典範。開放原始碼軟體、公開數據、可重現的分析流程。任何人都能驗證結果。任何人都能在此基礎上創新。

 

對未來觀測的意義

 

    許多檔案觀測將受益於amigo、dorito或類似方法。

GTO 1242計畫希望改進Blakely等人發表的PDS 70擬合。延伸到相同計畫觀測的其他過渡盤:HD 135344 B和HD 100546。DSHARP巡天中有大量原行星盤值得觀測。NGC 1068的例子顯示觀測活躍星系核內部環境很有價值。類星體宿主星系如3C 273也是目標。

 

Io的Keck自適應光學影像監測火山活動。AMI可能是有價值的補充。這項技術不只適用於AMI。原則可擴展到其他干涉儀、日冕儀、甚至傳統成像。關鍵是建立端到端可微分模型。讓機器學習方法直接處理原始數據。詹姆斯韋伯太空望遠鏡還有十年以上的運作壽命。這些新工具將榨出更多科學價值。百億美元的投資回報將持續增長。

 

 

參考資料來源

 

1. Charles, M., Desdoigts, L., Pope, B., et al. (2025). "Image reconstruction with the JWST Interferometer". Publications of the Astronomical Society of Australia. DOI待定。arXiv:2510.10924v1

2. Desdoigts, L., Pope, B., Charles, M., et al. (2025). "End-to-end differentiable modelling of NIRISS/AMI". Publications of the Astronomical Society of Australia, accepted.

3. Blakely, D., Johnstone, D., Cugno, G., et al. (2025). "High-contrast imaging of the PDS 70 system with JWST/NIRISS". AJ, 169, 137.

4. Isbell, J. W., Ertel, S., Pott, J. U., et al. (2025). "Infrared interferometric imaging of NGC 1068". Nature Astronomy, 9, 417.

5. Sanchez-Bermudez, J., de Pater, I., Conrad, A., et al. (2025). "Neural network reconstruction of Io's volcanic surface from JWST/AMI". MNRAS, 543, 608.

6. Lau, R. M., Hankins, M. J., Sanchez-Bermudez, J., et al. (2024). "JWST observations of the colliding-wind binary WR 137". ApJ, 963, 127.

7. Czekala, I., Jennings, J., Zawadzki, B., et al. (2025). "MPoL: A flexible Python platform for Radio and submm interferometric data". arXiv:2502.00100

8. amigo GitHub repository: https://github.com/[repository-path]

9. dorito GitHub repository: https://github.com/[repository-path]

10. Barbara A. Mikulski Archive for Space Telescopes (MAST): https://mast.stsci.edu/

11. JWST User Documentation: https://jwst-docs.stsci.edu/