Ai2 的全新開源語言模型：OLMo 2 究竟帶來了什麼？

圖靈學院內的文章包含三大主題：ESG浄零實驗室、AI實驗室及精實管理實驗室，我們會不定期分享相關主題之文章，也歡迎並對前述主題有興趣的學員投稿分享您的見解 (我要投稿)

圖靈學院創辦人科楠老師的願景

Ai2 的全新開源語言模型：OLMo 2 究竟帶來了什麼？

Source: Ai2 OLMo 2

圖靈學院
科楠
2024-12-3

隨著生成式人工智慧的快速發展，開源語言模型成為學術界和產業界的熱門研究方向。近日(2024-11-26)，Ai2 宣布推出全新開源語言模型系列——OLMo 2，這是一款參數規模達 70 億和 130 億（分別為 7B 和 13B）的模型，訓練資料量高達 5 兆個 tokens。不僅如此，OLMo 2 還以其開放性和性能穩定性，與市面上的其他開源模型形成鮮明對比。

OLMo 2 的核心特點

Source: OLMo 2: The best fully open language model to date

1. 高穩定性的訓練過程

在開發大型語言模型的過程中，訓練穩定性一直是技術挑戰之一。針對這一問題，AI2 團隊設計了一套獨特的技術方案，減少訓練過程中的損失波動（loss spike），確保模型在長時間訓練後仍然保持穩定的性能輸出。

2. 分階段訓練策略

AI2 採用了分階段訓練策略，尤其在預訓練的後期階段，通過學習率退火（learning rate annealing）和數據課程（data curriculum）來補足模型早期訓練時未能成功學到的知識或能力，這種方式能夠顯著提升模型的整體表現。

3. 最新的指令微調技術

AI2 引入了來自 Tülu 3 的最新微調技術，開發出指令優化版本——OLMo 2-Instruct，並推出 13B 的模型供用戶試用。目前，用戶可以通過 AI2 的 playground 平台，體驗其卓越的指令執行能力。

4. 開放語言建模評估系統（OLMES）

AI2 開發了一套專屬的開放語言建模評估框架，包括 20 個評估基準，涵蓋知識召回、常識推理、一般推理和數學推理等核心能力。這為模型的進一步改進提供了清晰的指標。

與市面主流開源模型的比較

以下是 OLMo 2 與其他主流開源模型的比較表：

OLMo 2 的優勢與市場定位

Source: OLMo 2: The best fully open language model to date

與其他開源模型相比，OLMo 2 在以下幾個方面具有顯著優勢：

1.全面開源： OLMo 2 不僅公開了模型權重，還提供了訓練數據、代碼、訓練配方、中間檢查點和指令微調模型，這在目前的開源模型中相當少見。

2.卓越的學術性能： 在英語學術基準測試中，OLMo 2 與 Llama 3.1 等頂尖模型競爭，展現了其強大的學術應用潛力。

3.高度可定制性： 開放的模型訓練配方和數據課程，使得研究者和開發者可以根據自己的需求進行二次開發，這對於學術界和產業界都極具吸引力。

未來展望

OLMo 2 的推出，不僅為開源語言模型樹立了新的標杆，也展現了開放科學的力量。隨著技術的不斷進步，未來我們可以期待更多基於 OLMo 2 的創新應用，例如更高效的學術搜索引擎、更精準的專業輔助系統以及個性化的 AI 助手。
AI2 的這一舉措，無疑為語言模型社群注入了新的活力，推動了開源技術的進一步發展。同時，透過與其他主流模型的競爭，OLMo 2 也為用戶提供了更多選擇。

原文參考：
OLMo 2: The best fully open language model to date