Cloud&AI
`
2025/6/11 08:37
法國 AI 實驗室 Mistral 推出推理模型 Magistral 系列,Small 版已開源
0
0

法國人工智能實驗室 Mistral 周二宣布進軍推理人工智能模型領(lǐng)域。6 月 10 日,Mistral 正式推出其首個推理模型系列 ——Magistral。該系列模型通過分步驟解決問題,旨在提升在數(shù)學、物理等學科領(lǐng)域的一致性和可靠性,與 OpenAI 的 o3 模型和谷歌的 Gemini 2.5 Pro 等其他推理模型類似。

Magistral 系列包含兩個版本:Magistral Small 和 Magistral Medium。Magistral Small 擁有 240 億參數(shù),已在人工智能開發(fā)平臺 Hugging Face 上以 Apache 2.0 許可證開放下載。而 Magistral Medium 是一個能力更強的模型,目前處于預覽階段,僅在 Mistral 的 Le Chat 聊天平臺、公司 API 以及第三方合作伙伴云平臺上提供。

Mistral 在其博客文章中表示:“Magistral 適用于廣泛的企業(yè)級應(yīng)用場景,包括結(jié)構(gòu)化計算、程序化邏輯、決策樹和基于規(guī)則的系統(tǒng)。這些模型經(jīng)過多步驟邏輯的微調(diào),能夠提升可解釋性,并以用戶語言提供可追溯的思考過程。”

Mistral 成立于 2023 年,是一家前沿模型實驗室,致力于開發(fā)一系列人工智能驅(qū)動的服務(wù),包括 Le Chat 和移動應(yīng)用程序。該公司獲得了 General Catalyst 等風險投資機構(gòu)的支持,目前已籌集超過 11 億歐元(IT之家注:現(xiàn)匯率約合 90.22 億元人民幣)的資金。

盡管 Mistral 擁有強大的資源,但在某些領(lǐng)域,例如開發(fā)推理模型方面,其落后于其他領(lǐng)先的人工智能實驗室。從 Mistral 自己的基準測試來看,Magistral 的競爭力似乎也不夠突出。在評估模型物理、數(shù)學和科學技能的 GPQA Diamond 和 AIME 測試中,Magistral Medium 的表現(xiàn)不如 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。此外,在流行的編程基準測試 LiveCodeBench 中,Magistral Medium 也未能超越 Gemini 2.5 Pro。

或許正因如此,Mistral 在其博客文章中著重強調(diào)了 Magistral 的其他優(yōu)勢。Mistral 聲稱,Magistral 在 Le Chat 上的答題速度是競爭對手的 10 倍,并且支持多種語言,包括意大利語、阿拉伯語、俄語和簡體中文。

該公司在文章中寫道:“基于我們的旗艦模型,Magistral 專為研究、戰(zhàn)略規(guī)劃、運營優(yōu)化和數(shù)據(jù)驅(qū)動決策而設(shè)計,無論是執(zhí)行多因素風險評估和建模,還是在約束條件下計算最優(yōu)交付窗口,都能勝任。”

Magistral 的發(fā)布是在 Mistral 推出“氛圍編程”客戶端 Mistral Code 之后不久。而在幾周前,Mistral 還發(fā)布了多個專注于編程的模型,并推出了 Le Chat Enterprise,這是一款面向企業(yè)的聊天服務(wù),提供人工智能代理構(gòu)建器等工具,并將 Mistral 的模型與 Gmail 和 SharePoint 等第三方服務(wù)集成。

免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網(wǎng)版權(quán)所有 舉報電話:021-54451141 用戶注銷