圖靈學院內的文章包含三大主題:ESG浄零實驗室、AI實驗室及精實管理實驗室,我們會不定期分享相關主題之文章,也歡迎並對前述主題有興趣的學員投稿分享您的見解  (我要投稿)

如何利用錯誤輔助微調大型語言模型推動製造業卓越發展
 

圖靈學院/科楠/2024-09-24

 

引言

 

    隨著人工智慧(AI)和大型語言模型(LLM)的發展,這些技術逐漸影響各個產業,尤其是智能製造。然而,將通用的LLM應用於製造業仍面臨著重大挑戰,特別是在處理製造專業知識和生成製造相關程式碼方面。本文將詳細介紹一篇學術論文——《Leveraging Error-Assisted Fine-Tuning Large Language Models for Manufacturing Excellence》,該論文提出了一種錯誤輔助微調的創新方法,專門針對製造業優化LLM的表現,並探討其獨特性、創新性以及未來發展方向。

 

1. LLM在製造業中的應用現狀

 

大型語言模型如GPT等,正逐步成為各領域信息檢索的核心工具,但在製造業中,這些模型的應用尚處於初期階段。雖然LLM能夠提供豐富的通用知識查詢,並在數據分析、自然語言處理等方面有著顯著成效,但由於製造業存在獨特的專業知識和複雜的程式碼需求,LLM在處理製造領域問題時往往表現不佳。製造業需要的是能夠理解並生成與製造工藝、機械控制和專業程式語言相關的解決方案。

 

2. 論文的研究目標

 

針對以上挑戰,論文提出了一種錯誤輔助的微調方法,這一方法的核心思想是將LLM專門調整為製造業專用。通過對模型進行微調,使其能夠有效理解製造領域的專業術語和程序語言,並能夠生成高效、可靠的程式碼。

 

該研究的主要目標如下:

 

  • 利用製造業的特定語料庫進行LLM微調,讓模型更加適應製造業的查詢需求。

 

  • 引入錯誤輔助的迭代提示流程,確保生成程式碼的正確性與有效性。

 

  • 通過閉環的錯誤修正過程,持續提升模型的表現,達到實際應用中所需的準確度與效率。

 

3. 創新性與獨特性

 

該研究具有三個顯著的創新點,這些創新確立了LLM在製造領域的應用新方向。

 

  •  針對製造業的LLM微調:此論文是首次針對製造領域進行LLM微調的研究,透過將LLM模型重新訓練於專門的製造領域語料庫上,使得模型能更精準地理解製造領域的查詢需求,這是一項開創性的探索。

 

  • 錯誤輔助的程式碼生成模式:該研究提出了一種新的程式碼生成方法,即錯誤輔助模式。該模式能夠自動提示語法錯誤,優化資源使用並校準使用者的期望。這種閉環提示迭代能夠顯著提升生成程式碼的準確性,並減少人為錯誤。

 

  •  閉環修正框架:通過錯誤輔助的閉環框架,該模型可以從各種錯誤中學習,並逐步優化生成結果。此框架為LLM提供了持續學習的能力,能夠隨著使用次數的增加而不斷提升模型效能,從而實現更可靠的製造業應用。

 

4. 方法論與技術細節

 

論文中的方法論主要分為三個步驟,分別是微調、錯誤輔助提示和閉環修正。

 

圖1:LLM在製造領域的微調流程

 

  • 製造業領域的LLM微調:微調過程使用了兩種數據集:一個是帶標籤的判斷數據集,用於監督學習;另一個是問答數據集,用於無監督學習。這些數據集來源於製造業中的技術文件、設備手冊和維修報告等,如圖1所示。

 

  • 錯誤輔助提示:這一步驟通過錯誤提示來幫助LLM生成更正確的程式碼。當模型生成的程式碼有語法錯誤時,系統會自動提示並進行修正。這種過程不僅確保程式碼語法正確,還能讓模型逐步學會生成符合預期的程式碼,如圖2所示。

 

圖2:錯誤輔助提示如何逐步引導模型生成正確程式碼
 
  • 閉環修正框架: 最後,通過閉環修正機制,模型可以在不斷生成程式碼的過程中學習和優化。這樣的反覆學習過程使模型能夠更準確地理解使用者的查詢需求,並能持續提升生成程式碼的品質,如圖3所示。

 

圖3:閉環修正框架的具體流程,強調該模型如何在錯誤輔助的過程中不斷進行自我改進

 

5. 案例分析

 

為驗證該方法的有效性,論文進行了兩個製造業應用案例的測試,分別是 “人機協作”和 “超精密加工”。

 

  • 人機協作程式碼生成:圖4中,在人機協作場景中,工程師希望生成機器人完成工具交接任務的程式碼。通用的LLM難以生成符合預期的程式碼,生成的結果中機械臂與人手的位置往往不匹配。然而,經過微調的LLM能夠生成正確考慮到手部位置的程式碼,使機械臂順利完成交接任務。

 

圖4:在人機協作中的程式碼生成過程,具體描述如何改進生成程式碼以符合現實應用場景

 

  • 超精密加工程式碼生成:在另一個案例中,工程師需要生成微透鏡陣列的表面模型程式碼。通過LLM生成的初步結果雖然表現出了微透鏡的模型,但未能滿足陣列的需求。然而,經過錯誤輔助微調後,模型生成的程式碼能夠正確地排列微透鏡,並使用直角坐標系來生成精確的表面模型,滿足了工程師的加工需求,圖5。

 

圖5:顯示生成的程式碼以及結果的進化過程

 

6. 未來發展

 

該研究展示了LLM在製造業中的巨大潛力,但同時也指出了未來研究的幾個方向:

 

  • 模型微調機制的改進:雖然目前的微調方法已經取得了一定成效,但模型的語義理解仍有改進空間。未來的研究可以探索如何更好地將語義知識融入LLM中,以進一步提升查詢回應的精準度。

 

  • 多標籤分類的應用:論文中對LLM的語言理解能力進行了二元分類的測試,但多標籤分類可能會是更適合的評估方法,能夠更加精確地反映模型的能力和不足。

 

  • 用戶滿意度評估:此外,未來的研究可以考慮增加用戶滿意度的調查,透過問卷收集使用者的反饋來進一步驗證模型的實際應用效果,這將有助於改進模型在實際場景中的表現。

 

結論

 

    該論文展示了如何通過錯誤輔助微調LLM來解決製造業中的應用挑戰,並且在多個案例中驗證了其方法的有效性。透過錯誤提示與閉環修正機制,該模型能夠不斷學習並改進,這不僅拓寬了LLM在製造領域的應用範圍,也為未來的製造技術創新提供了新的機遇。

隨著AI技術的不斷進步,這一研究方向有望在未來的製造業中扮演重要角色,為製造企業提升效率、減少錯誤並加速生產流程。

 

 

 

*這篇Blog以「如何利用錯誤輔助微調大型語言模型推動製造業卓越發展」為主題:
Xia, L., Li, C., Zhang, C., Liu, S., & Zheng, P. (2024). Leveraging error-assisted fine-tuning large language models for manufacturing excellence. Robotics and Computer-Integrated Manufacturing, 88, 102728. https://doi.org/10.1016/j.rcim.2024.102728