Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

如何利用錯誤輔助微調大型語言模型推動製造業卓越發展
 

圖靈學院/科楠/2024-09-24

 

引言

 

    隨著人工智慧(AI)和大型語言模型(LLM)的發展,這些技術逐漸影響各個產業,尤其是智能製造。然而,將通用的LLM應用於製造業仍面臨著重大挑戰,特別是在處理製造專業知識和生成製造相關程式碼方面。本文將詳細介紹一篇學術論文——《Leveraging Error-Assisted Fine-Tuning Large Language Models for Manufacturing Excellence》,該論文提出了一種錯誤輔助微調的創新方法,專門針對製造業優化LLM的表現,並探討其獨特性、創新性以及未來發展方向。

 

1. LLM在製造業中的應用現狀

 

大型語言模型如GPT等,正逐步成為各領域信息檢索的核心工具,但在製造業中,這些模型的應用尚處於初期階段。雖然LLM能夠提供豐富的通用知識查詢,並在數據分析、自然語言處理等方面有著顯著成效,但由於製造業存在獨特的專業知識和複雜的程式碼需求,LLM在處理製造領域問題時往往表現不佳。製造業需要的是能夠理解並生成與製造工藝、機械控制和專業程式語言相關的解決方案。

 

2. 論文的研究目標

 

針對以上挑戰,論文提出了一種錯誤輔助的微調方法,這一方法的核心思想是將LLM專門調整為製造業專用。通過對模型進行微調,使其能夠有效理解製造領域的專業術語和程序語言,並能夠生成高效、可靠的程式碼。

 

該研究的主要目標如下:

 

  • 利用製造業的特定語料庫進行LLM微調,讓模型更加適應製造業的查詢需求。

 

  • 引入錯誤輔助的迭代提示流程,確保生成程式碼的正確性與有效性。

 

  • 通過閉環的錯誤修正過程,持續提升模型的表現,達到實際應用中所需的準確度與效率。

 

3. 創新性與獨特性

 

該研究具有三個顯著的創新點,這些創新確立了LLM在製造領域的應用新方向。

 

  •  針對製造業的LLM微調:此論文是首次針對製造領域進行LLM微調的研究,透過將LLM模型重新訓練於專門的製造領域語料庫上,使得模型能更精準地理解製造領域的查詢需求,這是一項開創性的探索。

 

  • 錯誤輔助的程式碼生成模式:該研究提出了一種新的程式碼生成方法,即錯誤輔助模式。該模式能夠自動提示語法錯誤,優化資源使用並校準使用者的期望。這種閉環提示迭代能夠顯著提升生成程式碼的準確性,並減少人為錯誤。

 

  •  閉環修正框架:通過錯誤輔助的閉環框架,該模型可以從各種錯誤中學習,並逐步優化生成結果。此框架為LLM提供了持續學習的能力,能夠隨著使用次數的增加而不斷提升模型效能,從而實現更可靠的製造業應用。

 

4. 方法論與技術細節

 

論文中的方法論主要分為三個步驟,分別是微調、錯誤輔助提示和閉環修正。

 

圖1:LLM在製造領域的微調流程

 

  • 製造業領域的LLM微調:微調過程使用了兩種數據集:一個是帶標籤的判斷數據集,用於監督學習;另一個是問答數據集,用於無監督學習。這些數據集來源於製造業中的技術文件、設備手冊和維修報告等,如圖1所示。

 

  • 錯誤輔助提示:這一步驟通過錯誤提示來幫助LLM生成更正確的程式碼。當模型生成的程式碼有語法錯誤時,系統會自動提示並進行修正。這種過程不僅確保程式碼語法正確,還能讓模型逐步學會生成符合預期的程式碼,如圖2所示。

 

圖2:錯誤輔助提示如何逐步引導模型生成正確程式碼
 
  • 閉環修正框架: 最後,通過閉環修正機制,模型可以在不斷生成程式碼的過程中學習和優化。這樣的反覆學習過程使模型能夠更準確地理解使用者的查詢需求,並能持續提升生成程式碼的品質,如圖3所示。

 

圖3:閉環修正框架的具體流程,強調該模型如何在錯誤輔助的過程中不斷進行自我改進

 

5. 案例分析

 

為驗證該方法的有效性,論文進行了兩個製造業應用案例的測試,分別是 “人機協作”和 “超精密加工”。

 

  • 人機協作程式碼生成:圖4中,在人機協作場景中,工程師希望生成機器人完成工具交接任務的程式碼。通用的LLM難以生成符合預期的程式碼,生成的結果中機械臂與人手的位置往往不匹配。然而,經過微調的LLM能夠生成正確考慮到手部位置的程式碼,使機械臂順利完成交接任務。

 

圖4:在人機協作中的程式碼生成過程,具體描述如何改進生成程式碼以符合現實應用場景

 

  • 超精密加工程式碼生成:在另一個案例中,工程師需要生成微透鏡陣列的表面模型程式碼。通過LLM生成的初步結果雖然表現出了微透鏡的模型,但未能滿足陣列的需求。然而,經過錯誤輔助微調後,模型生成的程式碼能夠正確地排列微透鏡,並使用直角坐標系來生成精確的表面模型,滿足了工程師的加工需求,圖5。

 

圖5:顯示生成的程式碼以及結果的進化過程

 

6. 未來發展

 

該研究展示了LLM在製造業中的巨大潛力,但同時也指出了未來研究的幾個方向:

 

  • 模型微調機制的改進:雖然目前的微調方法已經取得了一定成效,但模型的語義理解仍有改進空間。未來的研究可以探索如何更好地將語義知識融入LLM中,以進一步提升查詢回應的精準度。

 

  • 多標籤分類的應用:論文中對LLM的語言理解能力進行了二元分類的測試,但多標籤分類可能會是更適合的評估方法,能夠更加精確地反映模型的能力和不足。

 

  • 用戶滿意度評估:此外,未來的研究可以考慮增加用戶滿意度的調查,透過問卷收集使用者的反饋來進一步驗證模型的實際應用效果,這將有助於改進模型在實際場景中的表現。

 

結論

 

    該論文展示了如何通過錯誤輔助微調LLM來解決製造業中的應用挑戰,並且在多個案例中驗證了其方法的有效性。透過錯誤提示與閉環修正機制,該模型能夠不斷學習並改進,這不僅拓寬了LLM在製造領域的應用範圍,也為未來的製造技術創新提供了新的機遇。

隨著AI技術的不斷進步,這一研究方向有望在未來的製造業中扮演重要角色,為製造企業提升效率、減少錯誤並加速生產流程。

 

 

 

*這篇Blog以「如何利用錯誤輔助微調大型語言模型推動製造業卓越發展」為主題:
Xia, L., Li, C., Zhang, C., Liu, S., & Zheng, P. (2024). Leveraging error-assisted fine-tuning large language models for manufacturing excellence. Robotics and Computer-Integrated Manufacturing, 88, 102728. https://doi.org/10.1016/j.rcim.2024.102728