[新聞] 阿里巴巴也發表新AI 號稱贏過DeepSeek

作者: bike3905 (RKTxLeo)   2025-01-29 20:26:27
阿里巴巴也發表新AI 號稱贏過DeepSeek V3
ETToday 記者蔡紹堅/綜合報導
中國大陸新創AI公司DeepSeek近期發表的兩款模型受到全球關注,阿里巴巴旗下的阿里雲也
緊跟其後發表了全新的「通義千問」Qwen 2.5-Max模型,並聲稱在測試中的表現超越了Deep
Seek V3。
據介紹,通義千問Qwen 2.5-Max是一款MoE模型,使用超過20兆token的預訓練數據及精心設
計的後訓練方案進行訓練。
阿里雲直接對比了指令模型的性能表現,比較的對象包括DeepSeek V3、GPT-4o和Claude-3.
5-Sonnet。
在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond 等基準測試中,Qwen2.5-Max的
表現超越了 DeepSeekV3,同時在MMLU-Pro等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模
型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模
型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
對比結果顯示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。
研發團隊表示,他們相信,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達
到更高的水平。
目前,用戶可透過API的方式訪問Qwen 2.5-Max,或登入Qwen Chat進行體驗,例如直接與模
型對話,或使用 artifacts、搜索等功能。
https://bit.ly/42ssBF8

Links booklink

Contact Us: admin [ a t ] ucptt.com