Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

法國Mistral AI 推出新一代邊緣AI模型:Ministral 3B和Ministral 8B

 

Source:Mistral AI

 

圖靈學院
科楠
2024-10-23

 

    隨著AI技術的快速發展,對於本地運算和邊緣推論的需求逐漸增加。法國Mistral AI公司近期推出了兩款革命性的邊緣AI模型,名為Ministral 3B和Ministral 8B,這些模型在裝置運算和邊緣使用情境中表現出色,為前沿AI應用帶來了創新解決方案。這些模型的推出旨在解決日益增長的本地化AI需求,尤其是在無網絡連接的環境下進行智慧推論和本機分析。

 

Mistral AI 的創新邊緣模型:Ministraux 3B與8B

 

    Ministraux系列模型以其在知識應用、常識推理和函式呼叫方面的高效表現為特色,尤其是在10B以下的模型中脫穎而出。Ministral 3B和8B模型支持高達128k的上下文長度,使其能夠處理更大範圍的輸入資訊。特別是Ministral 8B,它搭載了交錯滑動視窗注意力機制,顯著提高了推論速度並減少內存佔用,這使其在資源有限的邊緣設備中表現出色。

 

主要使用情境

 

    Ministraux系列模型設計用於滿足各種使用情境的需求,尤其適合於裝置翻譯、智慧助理、自主機器人等無網絡推論的場景。無論是獨立業餘愛好者還是全球製造團隊,都可以受益於這些模型的高效能和低延遲表現。

 

此外,Ministraux模型也能與更大型的語言模型(如Mistral Large)結合使用,作為多步驟代理工作流程中的高效中介。它能夠以極低的延遲和成本完成任務解析、路由和API呼叫,使其成為多元應用的理想選擇。

 

效能與基準測試

 

    在多項基準測試中,Ministral 3B和8B的表現均超越同類型的邊緣AI模型。Mistral AI的內部測試顯示,Ministraux系列在知識應用、推理能力以及成本效益等方面都具備卓越表現。


預訓模型

 

表 1:Ministral 3B 和 8B 模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 和 Mistral 7B 在多個類別上的比較

 

圖 1:Ministral 3B 與 8B 基礎模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B 與 Mistral 7B 的比較

 

指導模型


表 2:Ministral 3B 和 8B Instruct 模型與 Gemma 2 2B、Llama 3.2 3B、Llama 3.1 8B、Gemma 2 9B 和 Mistral 7B 在不同評估類別上的比較。

 

圖 2:3B 系列 Instruct 模型的比較 - Gemma 2 2B、Llama 3.2 3B 和 Ministral 3B。該圖展示了 Ministral 3B 相對於更大的 Mistral 7B 的改進。

 

 

 

圖 3:8B 系列 Instruct 型號的比較 - Gemma 2 9B、Llama 3.1 8B、Mistral 7B 和 Ministral 8B。


與市場上其他模型的比較

 

    在邊緣AI領域,Ministral 3B和8B模型在推理速度、內存效率以及上下文處理能力方面顯著領先市場上的競爭對手。

 

1. 與Llama 3.2和Gemma 2的比較  
   市場上受歡迎的小型模型如Llama 3.2 3B和Gemma 2 2B在某些應用中表現不錯,但在推理速度和內存使用效率方面,卻無法與Ministraux系列匹敵。Ministral 3B在知識應用和常識推理方面的表現尤其出色,甚至超越了這些競爭對手。

 

2. 與Mistral 7B的內部比較
   儘管Mistral 7B已經是市場中的佼佼者,但Ministral 3B和8B在模型大小、推理速度和能效等方面有進一步的提升,特別是在邊緣運算和本地推論的應用中,Ministral 8B的交錯滑動視窗注意力機制顯著加快了推論速度,並降低了內存使用量,這是目前市場上類似模型所不具備的優勢。

 

3. 上下文處理能力 
   當前大多數邊緣AI模型的上下文長度僅支持到32k,而Ministraux系列支持高達128k的上下文長度,這意味著它能夠處理更多的輸入數據,從而提升推理精度和應用範圍。

 

4. 成本與效率對比 
   市面上的大型語言模型如Gemma 9B和Llama 3.1 8B雖然在基準測試中表現不錯,但其在實際應用中的成本和效率卻不及Ministral系列。Ministral 8B的設計顯著降低了延遲和計算成本,特別適合於需要多步驟代理和任務路由的場景。

 

商業應用與部署

 

    目前,Ministral 3B和8B模型已經上市。企業可以聯繫Mistral AI進行商業授權,或者針對特定的使用情境進行模型的無損量化調整,進一步提升模型的效能。此外,研究人員也可以使用模型的權重,進行多元實驗和應用。

 

Mistral AI持續推動前沿AI技術的發展,儘管Mistral 7B已經是市場中的佼佼者,但最新的Ministral 3B和8B在多項測試中均展現出卓越能力,特別適合於本地推論和邊緣運算的多元化應用。

 

總體來說,Ministral 3B和8B模型在推理速度、內存使用效率和上下文處理能力方面表現出色,超越了當前市場上的其他小型邊緣AI模型。與Llama和Gemma系列相比,Ministral模型不僅能夠節省計算資源,還能顯著提升效能,特別適合本地推論、智慧助理和自動化工作流等應用場景。

 

圖片及資料來源:Mistral AI官網