
圖靈學院
科楠老師
2025-10-31
太空觀測遇上機器學習的革命性突破
詹姆斯韋伯太空望遠鏡(JWST)升空三年後,科學家面臨一個棘手問題。這台造價百億美元的設備搭載的孔徑遮罩干涉儀(AMI)無法發揮預期性能。探測器的非線性誤差嚴重限制了觀測能力。傳統校正方法束手無策。來自雪梨大學、麥覺理大學和約翰霍普金斯大學的研究團隊提出解決方案。他們開發了名為"dorito"的影像重建系統。這套工具結合自動微分技術與神經網絡模型。結果令人驚艷。
探測器的致命缺陷
AMI使用HAWAII-2RG CMOS探測器。這款設備有個嚴重問題:電荷會從較亮的像素擴散到鄰近像素。科學界稱之為「Brighter-Fatter Effect」(BFE)。明亮特徵在影像中變得更寬更胖。這個現象無法用傳統傅立葉平面校正方法處理。AMI的影像平面採樣率剛好達到奈奎斯特標準。探測器對電荷遷移特別敏感。早期分析顯示,所有現存的數據處理管道都遇到相同瓶頸。AMICAL、SamPy、SAMPip等工具無法突破感度極限。搜尋暗淡伴星的任務嚴重受阻。

端到端的可微分建模
研究團隊的策略徹底不同。他們建立完整的儀器前向模型。這個模型涵蓋光學系統到探測器的每個環節。關鍵技術是使用Jax程式庫。Jax提供自動微分功能。系統可以計算模型中每個參數對最終影像的影響。這讓梯度下降法等優化演算法能夠有效運作。團隊開發的amigo基礎模型整合了光學模型與「有效探測器模型」。後者是個神經網路。它學習模擬BFE等探測器效應。研究人員用校準數據集訓練這個網路。訓練完成後,基礎模型的遮罩測量參數與電子特性參數固定不變。科學家只需調整鏡面形狀參數與天體物理場景參數。系統直接對像素級斜坡數據建模。這種方法繞過傅立葉平面校正的難題。
兩種影像重建策略
dorito系統提供兩種方法。
方法一:影像平面直接建模
系統將解析後的光源建模為與光源分布陣列的卷積。整個擬合過程在影像平面進行。完全不使用複數可見度。
擬合參數包括:
- 每次曝光的位置
- 每次曝光的通量
- 每個目標每個濾鏡的光譜
- 科學目標的對數分布
- 校準星的鏡面像差
這個方法在探測器非線性主導誤差來源時表現最好。
方法二:DISCO不變量方法
團隊開發了「延遲不敏感校準觀測量子空間」(DISCO)方法。這延伸了核相位理論。AMI的遮罩孔徑相對於分離距離來說相當大。系統需要處理低空間頻率資訊。遮罩不完全共軛於望遠鏡瞳孔平面。需要小量菲涅爾散焦。傳統閉合相位不再保持不變性。DISCO方法產生核算子。這個算子將受波前誤差影響的可見度模式清零。系統追蹤參數的協方差。重新對角化後得到統計獨立的觀測量。這些觀測量對波前誤差、近場效應和光譜校準誤差都具有韌性。


正則化技術的選擇
影像重建是個病態反問題。許多不同影像都能同樣良好地擬合數據。正則化技術限縮解空間。
dorito預設實作幾種正則化方法:
最大熵正則化
追求最大夏農熵的影像。這類影像包含最少組態資訊。任何結構都需要數據證據支持。
總變差正則化
使用空間梯度的L1範數。這種方法傾向產生通量高原區域。邊緣保持清晰。過度正則化會產生卡通化特徵。
二次變差正則化
使用空間梯度的L2範數。這平滑影像。相鄰像素的值差異受到懲罰。
研究團隊使用L曲線方法選擇超參數。對於不同的λ值優化影像。繪製對數似然項對對數先驗項的圖。最佳λ值對應曲線的肘部。

三個標竿案例
NGC 1068:活躍星系核心的精細結構
NGC 1068是典型的第二型賽佛特星系。距離地球約14百萬秒差距。中心有個質量約三千萬太陽質量的超大質量黑洞。研究團隊使用方法一加總變差正則化重建影像。觀測使用F380M、F430M、F480M三個濾鏡。採用五點次像素抖動模式。重建影像顯示中心亮核東南方約0.1角秒處有延伸結構。大型雙筒望遠鏡干涉儀(LBTI)在8.7微米的影像高度吻合。AMI在較短波長揭露更多細節。明亮區域位於超大質量黑洞投影距離約10秒差距的位置。這裡外流與塵埃環境相互作用。塵埃昇華半徑約0.4秒差距。10秒差距處的塵埃能夠存活並再處理輻射。外流速度約每秒一千公里。熱點在10秒差距處意味活躍星系核運作至少一萬年。100秒差距內的過密度結構顯示活動持續約十萬年。
Io:火山月球的旋轉觀測
Io是木星最內側的伽利略衛星。極端潮汐力造就太陽系最活躍的火山活動。表面永遠有火山噴發。紅外光譜特別明亮。2022年8月1日,AMI觀測Io和校準星HD 2236。僅使用F430M濾鏡。五個次像素抖動位置。每個位置45組、100次積分。研究團隊將每次曝光視為獨立的非抖動影像。這樣能解析時間演化。Io每8.55分鐘自轉1.21度。這個旋轉可以分辨。
重建影像偵測五個已知火山特徵:
1. Seth Patera
2. P197
3. Masubi
4. Leizi Fluctus
5. Amirani
這些熱點在預期位置出現。月球邊緣清晰可辨。整個觀測序列顯示表面旋轉。團隊沒有觀察到Seth Patera周圍的擴散發射。Keck觀測和先前AMI分析都看到這個特徵。研究人員認為那可能是未校正的BFE或PSF結構。

WR 137:碰撞風雙星的考驗
WR 137是碰撞風雙星系統。富碳沃夫-拉葉星與O9型伴星組成。軌道相位調節碰撞風交互作用強度。產生約13年週期的紅外光變。塵埃隨高速風外流。形成螺旋形態的膨脹結構。這類「風車」系統在近紅外和中紅外都很亮。2022年三次觀測期間發生鏡面傾斜事件。第一次觀測幾乎完成所有科學數據後,才輪到校準星。鏡面突然移動。校準星遭遇的波前與科學目標不同。研究團隊使用方法二加最大熵正則化處理這個數據集。僅用傾斜事件後的第二和第三觀測期(7月15日和8月8日)聯合擬合。重建影像顯示沿東南-西北方向的條紋。所有早期重建都看到這個特徵。長度和方向符合側向觀看的碰撞風雙星風車星雲模型。為測試DISCO對波前誤差的韌性,團隊也重建傾斜事件前的7月13日數據。這些科學曝光用7月15日的校準曝光校正。兩者波前顯著不同。方法一產生的影像充滿光譜相依的非物理校準假影。方法二產生的影像相對乾淨。視覺上與另兩個觀測期的影像相似。DISCO不變量確實對波前誤差具有韌性。

GPU加速與自動微分的威力
整個系統建構在Jax上。Jax是Google開發的數值計算程式庫。核心優勢有三:
1. 自動微分:系統自動計算損失函數對所有參數的梯度。不需要手動推導。這讓複雜模型的優化變得可行。
2. GPU加速:計算在圖形處理器上執行。數百萬或數十億參數的模型訓練時間大幅縮短。相對平價的硬體就能運行。
3. 即時編譯:Jax使用XLA編譯器。程式碼執行前優化。運算效率接近手寫C++或Fortran。
研究團隊還使用PyTorch生態系的MPoL作為靈感來源。MPoL是處理電波/次毫米波干涉數據的正則化最大似然影像重建框架。已成功應用於ALMA連續譜觀測的原行星盤。
未來方向與建議
研究團隊提出幾點觀測策略建議:
1.增加組數
在保持最大井深低於約三萬計數的前提下,增加斜坡採樣的組數。這改善訊噪比。
2.類似亮度的校準星
校準星和科學目標應該有相似亮度。觀測到相似井深。這確保BFE特性一致。
3.多點次像素抖動
使用盡可能多的次像素抖動位置。這更好地分離探測器效應與天體物理資訊。許多AMI觀測試圖讓目標保持在相同次像素位置。研究團隊認為這是錯誤策略。
4.免校準星干涉術的可能性
JWST進行頻繁的波前感測測量。每48小時漂移小於10奈米均方根。除了傾斜事件外,任何時刻對波前的了解幾乎與點源參考校準一樣好。這開啟免校準星干涉術的可能性。CAL-SCI或CAL-SCI-CAL觀測序列可能不再必要。時間開銷和約束條件大幅降低。團隊建議對這個選項進行基準測試。
5.不完全清零波前模式
DISCO方法將所有受波前誤差影響的可見度線性組合清零。這很極端。對複雜場景的影像重建來說,損失太多傅立葉模式。如果適當傳播校準星或例行波前感測的波前誤差,可能避免完全清零這些模式。同時保留自我校準的好處。
機器學習的下一步
正則化最大似然法是天文學影像重建的標準方法。表現良好。但遠非最現代或最精密的途徑。像素基底在這裡表現不錯。沒有理由認為它是最優的。小波基底正在dorito中實作。機器學習提供許多改進途徑:
分數基底的先驗與似然
使用擴散模型或流模型學習影像分布。生成式AI技術可能大幅改善重建品質。
深度影像先驗
神經網路本身作為影像表示。不需要預訓練。網路結構隱含提供正則化。
資訊場論
貝葉斯框架的擴展。處理連續場的不確定性。
自編碼器
Io的AMI工作已展示這個方向的潛力。編碼器學習緊湊的影像表示。解碼器重建完整影像。這些方法在解析接近內工作角的光源時特別有影響力。也能推廣到日冕儀數據的可微分渲染。那裡問題更非線性。接近內工作角處場景扭曲更嚴重。
開源生態系的力量
所有程式碼和數據公開可取得。amigo模型和管線在GitHub託管。dorito模型也在GitHub上。附帶本文結果的範例筆記本。
數據來自Barbara A. Mikulski太空望遠鏡檔案館(MAST)。研究團隊鼓勵其他研究者改編和應用這些工具到自己的干涉數據集。這展示現代科學研究的新典範。開放原始碼軟體、公開數據、可重現的分析流程。任何人都能驗證結果。任何人都能在此基礎上創新。
對未來觀測的意義
許多檔案觀測將受益於amigo、dorito或類似方法。
GTO 1242計畫希望改進Blakely等人發表的PDS 70擬合。延伸到相同計畫觀測的其他過渡盤:HD 135344 B和HD 100546。DSHARP巡天中有大量原行星盤值得觀測。NGC 1068的例子顯示觀測活躍星系核內部環境很有價值。類星體宿主星系如3C 273也是目標。
Io的Keck自適應光學影像監測火山活動。AMI可能是有價值的補充。這項技術不只適用於AMI。原則可擴展到其他干涉儀、日冕儀、甚至傳統成像。關鍵是建立端到端可微分模型。讓機器學習方法直接處理原始數據。詹姆斯韋伯太空望遠鏡還有十年以上的運作壽命。這些新工具將榨出更多科學價值。百億美元的投資回報將持續增長。
參考資料來源
1. Charles, M., Desdoigts, L., Pope, B., et al. (2025). "Image reconstruction with the JWST Interferometer". Publications of the Astronomical Society of Australia. DOI待定。arXiv:2510.10924v1
2. Desdoigts, L., Pope, B., Charles, M., et al. (2025). "End-to-end differentiable modelling of NIRISS/AMI". Publications of the Astronomical Society of Australia, accepted.
3. Blakely, D., Johnstone, D., Cugno, G., et al. (2025). "High-contrast imaging of the PDS 70 system with JWST/NIRISS". AJ, 169, 137.
4. Isbell, J. W., Ertel, S., Pott, J. U., et al. (2025). "Infrared interferometric imaging of NGC 1068". Nature Astronomy, 9, 417.
5. Sanchez-Bermudez, J., de Pater, I., Conrad, A., et al. (2025). "Neural network reconstruction of Io's volcanic surface from JWST/AMI". MNRAS, 543, 608.
6. Lau, R. M., Hankins, M. J., Sanchez-Bermudez, J., et al. (2024). "JWST observations of the colliding-wind binary WR 137". ApJ, 963, 127.
7. Czekala, I., Jennings, J., Zawadzki, B., et al. (2025). "MPoL: A flexible Python platform for Radio and submm interferometric data". arXiv:2502.00100
8. amigo GitHub repository: https://github.com/[repository-path]
9. dorito GitHub repository: https://github.com/[repository-path]
10. Barbara A. Mikulski Archive for Space Telescopes (MAST): https://mast.stsci.edu/
11. JWST User Documentation: https://jwst-docs.stsci.edu/
Copyright © 2025 利創智能科技股份有限公司 All rights reserved.
Replace this text with information about you and your business or add information that will be useful for your customers.
