圖靈學院內的文章包含三大主題:ESG浄零實驗室、AI實驗室及精實管理實驗室,我們會不定期分享相關主題之文章,也歡迎並對前述主題有興趣的學員投稿分享您的見解  (我要投稿)

法國Mistral AI 推出新一代邊緣AI模型:Ministral 3B和Ministral 8B

 

Source:Mistral AI

 

圖靈學院
科楠
2024-10-23

 

    隨著AI技術的快速發展,對於本地運算和邊緣推論的需求逐漸增加。法國Mistral AI公司近期推出了兩款革命性的邊緣AI模型,名為Ministral 3B和Ministral 8B,這些模型在裝置運算和邊緣使用情境中表現出色,為前沿AI應用帶來了創新解決方案。這些模型的推出旨在解決日益增長的本地化AI需求,尤其是在無網絡連接的環境下進行智慧推論和本機分析。

 

Mistral AI 的創新邊緣模型:Ministraux 3B與8B

 

    Ministraux系列模型以其在知識應用、常識推理和函式呼叫方面的高效表現為特色,尤其是在10B以下的模型中脫穎而出。Ministral 3B和8B模型支持高達128k的上下文長度,使其能夠處理更大範圍的輸入資訊。特別是Ministral 8B,它搭載了交錯滑動視窗注意力機制,顯著提高了推論速度並減少內存佔用,這使其在資源有限的邊緣設備中表現出色。

 

主要使用情境

 

    Ministraux系列模型設計用於滿足各種使用情境的需求,尤其適合於裝置翻譯、智慧助理、自主機器人等無網絡推論的場景。無論是獨立業餘愛好者還是全球製造團隊,都可以受益於這些模型的高效能和低延遲表現。

 

此外,Ministraux模型也能與更大型的語言模型(如Mistral Large)結合使用,作為多步驟代理工作流程中的高效中介。它能夠以極低的延遲和成本完成任務解析、路由和API呼叫,使其成為多元應用的理想選擇。

 

效能與基準測試

 

    在多項基準測試中,Ministral 3B和8B的表現均超越同類型的邊緣AI模型。Mistral AI的內部測試顯示,Ministraux系列在知識應用、推理能力以及成本效益等方面都具備卓越表現。


預訓模型

 

表 1:Ministral 3B 和 8B 模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 和 Mistral 7B 在多個類別上的比較

 

圖 1:Ministral 3B 與 8B 基礎模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 與 Mistral 7B 的比較

 

指導模型


表 2:Ministral 3B 和 8B Instruct 模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B、Gemma 2 9B 和 Mistral 7B 在不同評估類別上的比較。

 

圖 2:3B 系列 Instruct 模型的比較 - Gemma 2 2B、Llama 3.2 3B 和 Ministral 3B。該圖展示了 Ministral 3B 相對於更大的 Mistral 7B 的改進。

 

 

 

圖 3:8B 系列 Instruct 型號的比較 - Gemma 2 9B、Llama 3.1 8B、Mistral 7B 和 Ministral 8B。


與市場上其他模型的比較

 

    在邊緣AI領域,Ministral 3B和8B模型在推理速度、內存效率以及上下文處理能力方面顯著領先市場上的競爭對手。

 

1. 與Llama 3.2和Gemma 2的比較  
   市場上受歡迎的小型模型如Llama 3.2 3B和Gemma 2 2B在某些應用中表現不錯,但在推理速度和內存使用效率方面,卻無法與Ministraux系列匹敵。Ministral 3B在知識應用和常識推理方面的表現尤其出色,甚至超越了這些競爭對手。

 

2. 與Mistral 7B的內部比較
   儘管Mistral 7B已經是市場中的佼佼者,但Ministral 3B和8B在模型大小、推理速度和能效等方面有進一步的提升,特別是在邊緣運算和本地推論的應用中,Ministral 8B的交錯滑動視窗注意力機制顯著加快了推論速度,並降低了內存使用量,這是目前市場上類似模型所不具備的優勢。

 

3. 上下文處理能力 
   當前大多數邊緣AI模型的上下文長度僅支持到32k,而Ministraux系列支持高達128k的上下文長度,這意味著它能夠處理更多的輸入數據,從而提升推理精度和應用範圍。

 

4. 成本與效率對比 
   市面上的大型語言模型如Gemma 9B和Llama 3.1 8B雖然在基準測試中表現不錯,但其在實際應用中的成本和效率卻不及Ministral系列。Ministral 8B的設計顯著降低了延遲和計算成本,特別適合於需要多步驟代理和任務路由的場景。

 

商業應用與部署

 

    目前,Ministral 3B和8B模型已經上市。企業可以聯繫Mistral AI進行商業授權,或者針對特定的使用情境進行模型的無損量化調整,進一步提升模型的效能。此外,研究人員也可以使用模型的權重,進行多元實驗和應用。

 

Mistral AI持續推動前沿AI技術的發展,儘管Mistral 7B已經是市場中的佼佼者,但最新的Ministral 3B和8B在多項測試中均展現出卓越能力,特別適合於本地推論和邊緣運算的多元化應用。

 

總體來說,Ministral 3B和8B模型在推理速度、內存使用效率和上下文處理能力方面表現出色,超越了當前市場上的其他小型邊緣AI模型。與Llama和Gemma系列相比,Ministral模型不僅能夠節省計算資源,還能顯著提升效能,特別適合本地推論、智慧助理和自動化工作流等應用場景。

 

圖片及資料來源:Mistral AI官網