Re: [問卦] 中國開源與openAI o1同等級的deepseek R freeunixer PTT批踢踢實業坊

Re: [問卦] 中國開源與openAI o1同等級的deepseek R

作者: freeunixer (御劍客) 2025-01-21 16:46:33

※ 引述《derekhsu (浪人47之華麗的天下無雙)》之銘言：
: ※ 引述《logical01 (logical)》之銘言：
: : https://i.imgur.com/omWjjTa.jpeg
: : 中國一家人工智慧公司開源
: : 與openAI o1同等級的deepseek R1
: : LLM，商業利用也可以
: : 這是不是沒再甩美國的AI禁令了？
: 不是，這是遵守美國的AI禁令做出來的模型，他們的模型以及以及程式全部開源，公布當天就已經上架 Ollama ，用 qwen 以及 llama 作為學生模型做出來一個不同參數的模型萃取的小模型，在 32B的 qwen 上達到跟 o1 mini 同等水準。(qwen 是阿里巴巴的通義千問模型，一樣是開源的)
: 人家的東西全部開源，當天就可以下載測試，驗證資料都是公開的，使用本地模型，隱私還遠高於雲端模型。
: 全球排名前10的模型除了OpenAI Claude Google 以外，能排進去的只有阿里巴巴跟DeepSeek 其中只有中國的模型開源。
中國+香港其實有很多個模型,除了以前的bat,通義、文言、元寶,
還有後起直追的抖音雲雀(豆包)跟
第一家以 ai 企業上市但前幾年賠得一屁股的商湯日日新
除了這幾家之外,中國專門搞大模型有名的,至少還有七家(包括deepseek的深求)
深求比較奇葩的地方是他們不算正規特種作戰部隊,像是特別行動計畫徵召.
所以他們不是全都是科班頂尖,不精確的形容就是,不管雞鳴狗盜,反正各顯本事.
科技新創就是這樣,你不一定要當學界業界第一強,認清自己本事到哪,目標合理就好.
所以他們運氣不錯,另闢蹊徑摸到一條路出來.於是獲得超過預期的收穫.
但是十大排行榜這東西並不是一個絕對的評估指標,因為標準都是人訂的...
並且這個排行榜變化性很大,過幾天誰發了一個新模型,搞不好又變了
比如說,我手上一個前十大的榜,現在前十名的中國模型是深求跟零一...
為什麼說這個榜的評估標準不能直接當成選用的考慮依據?
因為測試有他的考慮,但你實際要用的時候,有可能必須要考慮他測試的以外的東西.
比如我最近常說我在叫 AI 幫我寫未成年不要看的 AV 劇本,
寫了幾幕後 AI 就開始發神經,公公叫成老公,太太看成娘...
這種問題,你要考慮的就不單純是某個 LLM 排行榜的排名...
中國人比較讓人討厭的地方是,普遍愛出髒手,
像是十之七八都會去弄 GPT 的資料出來訓練自己的模型.
搞了半天,你就是說你用他的測驗卷把自己的小孩卷得比他的小孩考得更好...
第二個就是,中國的商業模型,在中港澳以外的地方不好弄到使用(試用),
因為要必須中國境內的電話號碼.
我曾經為了試用某個模型,繞了一點路弄了一個帳號,
但那個帳號本來是用在它的其他業務項目的,
結果沒兩天,我就接到一個有禮,聲音甜美的女企業窗口經理電話,問我想對她做什麼..
啊,不是,是問我註冊那個帳號是對她公司的什麼服務有需求,有甚麼可以幫我的.

繼續閱讀

[新聞] 中國4地同日發生3級以上地震最高4.9級keane9112 Re: [問卦] Neil Gaiman被踢爆性侵犯多名女子zhunhantsai [問卦] 章魚燒為什麼很少在早餐跟半夜賣ㄋ？SaintSeven [問卦] 各位冷氣找人來保養沒（圖thewtf [新聞] 酸卓揆該學學高雄白喬茵踢爆：拿平均地ThisisLongID Re: [問卦] 「台積電也是吃政府奶水長大的」怎反駁kuosos520 [問卦] 天災還臭嘴的都什麼人？ncc5566 [爆卦] 總統:打詐破案1.3% 但警政署52% 誰騙人 usnavyseal Re: [爆卦] 數發部員工爆料！內部真實狀況！Muma5566 [問卦] 什麼時候會只承認男女？HTC92