Mistral AI 推出了大型語言模型 Devstral,專門針對解決軟體開發過程中出現的問題進行了最佳化。與典型的 AI 模型不同,Mistral AI 不僅僅編寫單獨的函數和程式碼完成,還提供允許您分析和情境化大型程式碼庫、確定元件之間的關係以及識別複雜函數中難以發現的錯誤的功能。
該模型涵蓋 23.6 億個參數,考慮了 128 萬個標記的上下文,並根據 Apache 2.0 許可證發布。 Devstral 的可下載檔案佔用 47 GB,適合在本機系統上使用——一台配備 NVIDIA GeForce RTX 4090 顯示卡和 32 GB RAM 的 PC 足以運行該模型。此模型可用於開源 SWE-agent 和 OpenHands 工具,以自動執行錯誤修復、程式碼分析和變更。
該系統可用於解決 GitHub 上的特定問題,並且明顯優於 SWE-Bench Verified 測試套件中的其他項目,該測試套件檢查程式碼中典型問題解決方案的正確性(它根據 GitHub 上的真實錯誤訊息提供 500 個測試)。本次測試中,Devstral模型得分為46.8%,而Claude 3.5 Haiku模型得分為40.6%,SWE-smith-LM 32B得分為40.2%,GPT-4.1-mini得分為23.6%。其中,Devstral 的表現優於 Deepseek-V3-0324 671B(38.8%)和 Qwen3 232B-A22B(34.4%)等大型模型,涵蓋數千億個參數。
來源: opennet.ru
