Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

AI Agent 是「心智的飛機」:《Nature》點名五大原則,科學家如何負責任地「駕駛」人工智?

 

 

圖靈學院編輯部
2026-3-3

 

當AI成為科學家的「機組人員」——一篇《Nature》評論引發的典範辯論

 

    2026年3月,頂尖學術期刊《Nature》刊出一篇罕見的未來宣言式評論,作者是美國西北大學凱洛格管理學院教授、Northwestern Innovation Institute 創辦人 Dashun Wang(王大順)。他向全球科學界提出一個刺激性的隱喻:AI Agent,是心智的飛機(aeroplanes for the mind)。這個比喻,來自對賈伯斯一句名言的再詮釋。1980年代初,蘋果共同創辦人賈伯斯曾說,電腦是「心智的自行車」——靈感來自一張《科學人》雜誌的圖表,顯示騎腳踏車的人類比任何動物都更省力。王教授認為,AI Agent 更進一步,是心智的飛機:速度遠超自行車,卻也更難操控,一旦失事,後果將遠比摔車嚴重。這個類比,不只是修辭。它折射出一個當下最關鍵的科學治理問題:當AI Agent 開始接管研究工作流程,科學家應如何確保自己仍是負責任的機長,而非把操縱桿拱手相讓?

 

從「AI科學家」的誘惑說起

 

    過去兩年,「AI 科學家」(AI Scientist)與「自駕式實驗室」(self-driving laboratory)席捲學術圈,從假說生成、實驗設計到論文撰寫,全程自動化的系統陸續問世,令人眩目。王教授 卻在評論中直指:科學不是生產線,也沒有固定的最佳化目標。 科學的本質是詮釋、爭辯與責任,三者都需要人類判斷,缺一不可。他以牛頓的稜鏡實驗為例。一套全自動系統,或許能忠實記錄白光折射成七色光譜的數據,並配出完美模型。但牛頓真正的天才之舉,是逆向操作:他把各色光束重新聚合,重組回白光,從而證明顏色屬於光本身,而非玻璃折射的結果。那個決定——把「看似誤差的異常」視為現象本身,而非需要消除的雜訊——是詮釋的跳躍,不是運算的輸出。自動化系統設計上傾向消除異常、最佳化擬合;科學家,卻恰恰是靠著善用「意外」推動突破的。

王教授也點出更深層的公民責任:在公眾對科學的信心已然脆弱的時代,科學的正當性建立在一份共同的社會契約之上——結論必須開放接受檢驗,作者必須對其證據負責,知識必須以公共利益為前提,誠信生產。完全自動化或許能給出一些答案,卻會腐蝕那些答案本身所賴以為憑的可信度。

 

SciSciGPT:人機協作的具體實踐

 

    王教授的主張不停留在理念層次。他的團隊開發了 SciSciGPT,一套以「科學之科學」(science of science)領域為試驗場的多智能體原型系統。系統核心是 ResearchManager 智能體,負責協調整體工作流程:將研究者的自然語言查詢拆解為文獻回顧、數據萃取、統計分析等子任務,分派給對應的專業智能體執行——這些智能體能自主撰寫程式碼、執行分析、生成圖表,同時由 EvaluationSpecialist 智能體持續稽核每一步驟的輸出品質。更重要的是,整個過程完整記錄,形成透明的端對端溯源日誌。實際案例中,SciSciGPT 完成了大學合作網絡的視覺化呈現,也驗證了論文圖表能否從原始資料庫重現,完成速度與品質均優於有經驗的研究者搭配一般 AI 工具的成效。

 

五大原則:讓科學家成為負責任的機長

 

    王教授從這段實踐中,歸納出科學界使用 AI Agent 的五項核心原則:

 

一、協作優於自動化(Collaboration beats automation)

 

    研究者是「機長」,AI 智能體是「機組人員」。理想的系統應由分析員智能體起草、批評者智能體質疑、規劃者智能體布局後續步驟、協調者智能體統籌同步。介面設計必須強化可操控性與意見分歧空間,讓研究者能審視推理過程、比較替代方案、推翻結論。框架問題、驗證路徑、簽署結論的責任,必須由人類科學家承擔。這套模式的實現,需要領域科學家、AI工程師、設計師與倫理學家的刻意協作,確保智能體放大人類創造力,而非取而代之。

 

二、速度本身就具有革命性(Speed by itself is transformative)

 

    當失敗成本崩潰,過去太昂貴或太耗時的研究問題,將變得合理可行。王教授以基因體學為例:解碼第一個人類基因組耗費十多年與數十億美元;如今,定序費用已低於一千美元且僅需數小時,整個領域從研究單一基因,躍升為探索整個基因組的廣闊景觀。速度也改變了誰有資格提問——技術與時間門檻的降低,讓小型實驗室、新進研究者甚至個人研究者,也能挑戰過去需要大型團隊才能完成的分析。然而,缺乏反思的快速科學,也可能讓錯誤以同等規模擴大,這正是人機協作不可或缺的理由。

 

三、智能體應高度專業化(Agents should specialize)

 

    各領域有各自的知識基礎:文本、數據集、工具與標準。化學領域的 AI 智能體,需要連結反應動力學模型、預測實驗失敗的資料庫;生醫領域需要臨床指引、試驗數據與多模態病患資料;數學則需要形式化證明庫。AI 研究智能體在各領域的面貌將大相逕庭,但應遵守相同的基本規則:結果可追溯、方法可驗證、責任歸屬清晰。建立這些規則,需要學術學會、資助機構、期刊、公共研究基礎設施與 AI 開發商協同制定共同框架,例如統一的智能體決策記錄標準,讓一個實驗室的分析,可被另一個實驗室稽核或重現。王教授 的研究同時揭示一個警訊:AI 的好處雖跨越所有學科,但 AI 教育卻嚴重集中在電腦科學、數學與工程領域,醫學、心理學、經濟學等同樣受益匪淺的學科,提供的相關訓練卻少得多,形成系統性的結構失衡。

 

四、信任必須被工程化(Trust must be engineered)

 

    腳踏車失事,後果通常局限於一人;飛機失事,代價往往是機上所有人,甚至地面的無辜者。AI Agent 的失誤,可能誤導整個學術領域、重新分配研究資金、侵蝕公眾對科學的信任。大型語言模型(LLM)有一個關鍵優勢:它們能寫作,因此能以純文字記錄自身的每一個決策。在 SciSciGPT 中,每一個步驟、每一行程式碼、每一個決定都由 LLM 自動記錄——即便是 王教授 最優秀的學生做實驗,他也無法重建每一個決策步驟;但有了 AI Agent,這件事成為可能。然而,記錄過多也是問題:部分研究者抱怨,核查 AI 輸出的時間比親自完成工作還長。解方不是記錄更多,而是記錄更好——設計能將原始溯源資料轉化為理解的系統,以結構化的方式呈現「為什麼做這個決定」,而非僅記錄「做了什麼」,並以分層摘要讓關鍵偏差與決策一目了然。AI Agent 也為科學最深層的挑戰 “可重現性” 提供了強力回應:研究顯示,不同人類研究團隊分析同一份數據集,往往得出不同結論;AI Agent 讓我們能系統性地研究這些分歧,也讓結論的驗證變得輕而易舉。

 

五、AI 將催生全新型態的科學家(AI will create a new kind of scientist)

 

    2016年,AlphaGo 的「第 37 手」震驚圍棋界——那是一步極不尋常的棋,令頂尖棋評瞠目結舌。但幾年內,頂尖棋手已將 AI 策略融入自身的棋藝repertoire。科學界正面臨相似的挑戰:AI Agent 可能提出在理論建構、異常偵測或假說設計上初看陌生的想法,問題在於科學家是否受過訓練,能分辨哪些是雜訊、哪些是值得學習的啟示。然而,這也帶來風險。對科學家個人而言,是技能侵蝕的風險,就像 GPS 導航讓我們不再記得路線;對科學整體而言,是同質化的風險——若大量研究者依賴相同的智能體組合,科學輸出將趨於收斂,集體思想多樣性將下降。研究已顯示,AI 可能提升個人表現,卻同時降低集體多樣性。因此,刻意設計思維多元化,培育使用不同框架的多種模型、鼓勵異議的制度規範,將成為下一代科學基礎設施的核心命題。

 

科學結構的再想像

 

    王教授最後以建築與電力的類比收尾,指出真正的突破往往不是把新技術套入舊框架,而是讓新技術催生全新的組織邏輯。鋼鐵與鋼筋混凝土問世之初,建築師只用它們模仿磚石外觀;真正的革命,是當他們意識到牆不再需要承重,建築才能被玻璃幕牆包裹,誕生聯合國秘書處大廈等現代主義經典。電力也是如此:工廠起初只是以電動馬達取代蒸汽機,毫無生產力提升;直到廠房佈局根據電力「哪裡都能輸送動力」的特性重新設計,生產力才真正飛躍。

AI Agent 的潛力,或許同樣需要我們重新想像科學本身的結構,而非只是把它套進現有的研究模式,讓現有的科學跑得更快。王大順教授在評論結尾指出,那張當年啟發賈伯斯的圖表,把騎腳踏車的人類置於最底部,是所有移動者中最有效率的。但在圖表的另一端,飛機高居其上:昂貴、耗能,卻也大膽無畏,開創了曾經難以想像的疆域。我們需要兩種隱喻同時在場:腳踏車提醒我們為效率與超越而設計;飛機則警示我們,規模需要信任的體系。

 

結語:我們將成為什麼樣的科學家?

 

    王大順教授的評論最終聚焦於一個深刻的文明問題:當 AI 有能力參與科學發現,真正重要的問題不是機器單獨能做什麼,而是我們如何設計它們,讓科學持續具有問責性與可重現性。歷史上的所有重大發現,都由人類完成。進入 AI 時代,這個事實或許會改變,但改變的方向,取決於科學家是否願意成為負責任的機長,而不是把操縱桿交給自動駕駛,然後在艙內睡著。每一架飛機,都需要一位清醒的機長在座艙裡。AI 的時代,不是「機長失業」的時代,而是對機長素質要求更高的時代。

 

 

資料來源: Dashun Wang, "Five principles for scientists using AI agents," Nature 651, 32–34 (2026). DOI: 10.1038/d41586-026-00665-y