[爆卦] Mistral Small 3模型發布比OpenAI更快更好 Sidney0503 PTT批踢踢實業坊

[爆卦] Mistral Small 3模型發布比OpenAI更快更好

作者: Sidney0503 (Sidney0503) 2025-02-01 04:34:50

Mistral Small 3模型發布比OpenAI和Google類似產品更快更好
歐洲領先的人工智慧公司之一 Mistral AI 推出了一款名為 Mistral Small 3 的新模型
。這是一個包含 240 億參數的模型，但與 Llama 3.3 70B 和 Qwen 32B 等大型模型相當
（至少在 MMLU-Pro 基準測試中）。它不僅運行速度與 Llama 3.3 70B 不相上下，而且
速度更快。
ChatGPT 上最常用的模型是 GPT-4o mini，它是使用者用完 GPT-4o 請求後的備用模型
。 Mistral Small 3 的效能比這個 OpenAI 模型更好，據說延遲也更低。
Mistral AI 介紹說："我們在Apache 2.0 下發布了預訓練和指令調整的檢查點。檢查點
可以作為加速進展的強大基礎。需要注意的是Mistral Small 3 既未使用RL 也未使用合
成資料進行訓練，因此與Deepseek R1（一項偉大而互補的開源技術！）等模型相比，它
在模型製作流程中處於較早階段。採用和定制它。
作為一個偏小型的模型，如果你的電腦配置較高，也有可能在自己的電腦上本地運行它
。 Mistral AI 表示，它可以在單塊NVIDIA RTX 4090 顯示卡或配備 32GB 記憶體的
MacBook 上運行。
雖然該機型在 MMLU-Pro 基準測試中的表現優於上述其他機型，但它並不總是人類評估人
員的首選。 Mistral 在一組超過 1k 的專有編碼和通用提示中將其模型與其他模型進行
了比較。研究發現，與 Gemma-2 27B 和 Qwen-32B 相比，Mistral Small 3 是首選方案
，但與 Llama 3.3 70B 和 GPT-4o mini 相比，Mistral Small 3 的首選度較低。

繼續閱讀

Re: [新聞] 宜蘭車禍1死3傷！追撞駕駛上香致歉　死amanda815625 [問卦] 感覺deepseek官網bot參數大於671b?HowLeeHi Re: [問卦] 為什麼中國要免費送deepseek開源？？Sidney0503 [問卦] CIA台灣辦公室在哪啊currry [問卦] 年紀越大對妹仔越膚淺？ffdqfe [問卦] 過年帶aespa寧寧回老家家裡長輩開心嗎jkljkl112233 Re: [問卦] 大陸都deepseek人工智能台灣只能點麵線？huzhou [問卦] iOS的捷徑功能484很好用lianpig5566 [問卦] 有跟印度人合作過的請進PatriStar Re: [問卦] 給建議：歐兔徵男友文這樣的要求條件會太高？intrepid123