Re: [問卦] 中國開源與openAI o1同等級的deepseek R

作者: freeunixer (御劍客)   2025-01-21 16:46:33
※ 引述《derekhsu (浪人47之華麗的天下無雙)》之銘言:
: ※ 引述《logical01 (logical)》之銘言:
: : https://i.imgur.com/omWjjTa.jpeg
: : 中國一家人工智慧公司開源
: : 與openAI o1同等級的deepseek R1
: : LLM, 商業利用也可以
: : 這是不是沒再甩美國的AI禁令了?
: 不是,這是遵守美國的AI禁令做出來的模型,他們的模型以及以及程式全部開源,公布當天就已經上架 Ollama ,用 qwen 以及 llama 作為 學生模型做出來一個不同參數的模型萃取的小模型,在 32B的 qwen 上達到跟 o1 mini 同等水準。(qwen 是阿里巴巴的通義千問模型,一樣是開源的)
: 人家的東西全部開源,當天就可以下載測試,驗證資料都是公開的,使用本地模型,隱私還遠高於雲端模型。
: 全球排名前10的模型除了OpenAI Claude Google 以外,能排進去的只有阿里巴巴跟DeepSeek 其中只有中國的模型開源。
中國+香港 其實有很多個模型,除了以前的bat,通義、文言、元寶,
還有後起直追的抖音雲雀(豆包)跟
第一家以 ai 企業上市但前幾年賠得一屁股的商湯日日新
除了這幾家之外,中國專門搞大模型有名的,至少還有七家(包括deepseek的深求)
深求比較奇葩的地方是他們不算正規特種作戰部隊,像是特別行動計畫徵召.
所以他們不是全都是科班頂尖,不精確的形容就是,不管雞鳴狗盜,反正各顯本事.
科技新創就是這樣,你不一定要當學界業界第一強,認清自己本事到哪,目標合理就好.
所以他們運氣不錯,另闢蹊徑摸到一條路出來.於是獲得超過預期的收穫.
但是十大排行榜這東西並不是一個絕對的評估指標,因為標準都是人訂的...
並且這個排行榜變化性很大,過幾天誰發了一個新模型,搞不好又變了
比如說,我手上一個前十大的榜,現在前十名的中國模型是 深求 跟 零一...
為什麼說這個榜的評估標準不能直接當成選用的考慮依據?
因為測試有他的考慮,但你實際要用的時候,有可能必須要考慮他測試的以外的東西.
比如我最近常說我在叫 AI 幫我寫 未成年不要看 的 AV 劇本,
寫了幾幕後 AI 就開始發神經,公公叫成老公,太太看成娘...
這種問題,你要考慮的就不單純是某個 LLM 排行榜的排名...
中國人比較讓人討厭的地方是,普遍愛出髒手,
像是十之七八都會去弄 GPT 的資料出來訓練自己的模型.
搞了半天,你就是說你用他的測驗卷把自己的小孩卷得比他的小孩考得更好...
第二個就是,中國的商業模型,在中港澳以外的地方不好弄到使用(試用),
因為要必須中國境內的電話號碼.
我曾經為了試用某個模型,繞了一點路弄了一個帳號,
但那個帳號本來是用在它的其他業務項目的,
結果沒兩天,我就接到一個有禮,聲音甜美的女企業窗口經理電話,問我想對她做什麼..
啊,不是,是問我註冊那個帳號是對她公司的什麼服務有需求,有甚麼可以幫我的.

Links booklink

Contact Us: admin [ a t ] ucptt.com