阿里巴巴發佈人工智慧模型 稱超越 DeepSeek
愛德華多·巴普蒂斯塔
2025年1月29日下午 5:12 GMT+8更新於一小時前
北京,1月29日(路透社)-中國科技公司阿里巴巴(9988.HK),開啟新分頁週三發布了新版本的Qwen 2.5 人工智慧模型,據稱該模型超越了廣受好評的 DeepSeek-V3。
Qwen 2.5-Max 的發佈時機非同尋常,恰逢大年初一,大多數中國人都下班了,與家人團聚,這表明中國人工智能新創公司DeepSeek在過去三週的迅速崛起給該公司帶來了壓力。
阿里巴巴雲端部門在其官方微信帳號上發布的公告中表示,“Qwen 2.5-Max 的性能幾乎全面優於GPT-4o、DeepSeek-V3 和Llama-3.1-405B”,指的是OpenAI 和Meta 最先進的開放技術- 來源人工智慧模型。
1 月 10 日發布的由 DeepSeek-V3 模型驅動的 DeepSeek 人工智能助手以及 1 月 20 日發布的 R1 模型震驚了矽谷,並導致科技股暴跌,據稱這家中國初創公司的發展速度較低,使用成本促使投資者質疑美國領先人工智慧公司的巨額支出計畫。
但DeepSeek的成功也引發了其國內競爭對手爭先恐後地升級自己的AI模型。
DeepSeek-R1 發布兩天后,TikTok 所有者字節跳動發布了其旗艦 AI 模型的更新,聲稱該模型在AIME 中的表現優於微軟支持的OpenAI 的o1,AIME 是一項基準測試,旨在衡量AI模型對複雜指令的理解和反應程度。
這與 DeepSeek 的說法相呼應,即其 R1 模型在多項效能基準上可與 OpenAI 的 o1 相媲美。
DEEPSEEK 與國內競爭對手的比較
DeepSeek V3模型的前身DeepSeek-V2去年5月發布後,在國內引發了一場AI模型價格戰。
事實上,DeepSeek-V2 是開源的,而且空前便宜,每 100 萬個代幣(或人工智慧模型處理的數據單位)僅需 1 元人民幣(0.14 美元),導致阿里巴巴的雲端部門宣布降價高達97 %。
其他中國科技公司也紛紛效仿,其中包括百度(9888.HK),開啟新分頁於2023年3月發布了中國第一個相當於ChatGPT的軟體,以及中國最有價值的網路公司騰訊(0700.HK),開啟新分頁。
DeepSeek 神秘的創始人梁文峰在 7 月罕見地接受中國媒體 Waves 採訪時表示,這家新創公司「並不關心」價格戰,而實現 AGI(通用人工智慧)是其主要目標。
OpenAI 將 AGI 定義為在最具經濟價值的任務中超越人類的自主系統。
雖然像阿里巴巴這樣的中國大型科技公司擁有數十萬名員工,但 DeepSeek 的運作就像一個研究實驗室,其工作人員主要由來自中國頂尖大學的年輕畢業生和博士生組成。
https://reurl.cc/WAg0nZ