[新聞] DeepSeek深夜發布新款開源AI模型

作者: messi5566 (沒吸五六)   2025-01-28 03:47:28
原文標題:
DeepSeek深夜發布新款開源AI模型Janus-Pro
原文連結:
https://news.cnyes.com/news/id/5847178
發布時間:
2025-01-28 01:51
記者署名:
羅昀玫
原文內容:
DeepSeek 週二 (28 日) 發布開源多模態人工智慧 (AI) 模型 Janus-Pro,其中
Janus-Pro-7B 在 GenEval 和 DPG-Bench 基準測試中打敗 OpenAI 的 DALL-E 3 和
Stable Diffusion。
DeepSeek 團隊正式發表兩款多模態框架,即 Janus-Pro 和 JanusFlow。
(圖片:蘋果)
(圖片:DeepSeek 專家)
Janus-Pro 是一款統一多模態理解與生成的創新框架,透過去耦合視覺編碼的方式,大幅
提升了模型在不同任務中的適配性與表現。
JanusFlow 是一款透過生成流 (Rectified Flow) 與自迴歸語言模型融合實現統一的框架
,不僅在理解任務中表現優異,還能製作高品質影像,同時展現框架設計的極簡與強大。
其優異表現顯示,Janus-Pro-7B 在人工智慧任務中具有競爭優勢,這可能會影響該領域
未來的研發方向。
隨著科技業努力應對 Janus-Pro-7B 的推出及其影響,現在市場高度關注在其他公司將如
何應對 DeepSeek 的挑戰。
AI 觀察家 Rowan Cheung 表示,DeepSeek 的新模型可以為人工智慧效能設定新標準。
AI 戰局正迅速變化,競爭可能會更加劇,新模式的出現,會導致進一步的創新,並可能
導致更多的市場波動。AI 寵兒輝達 (NVDA-US) 在美股週一午盤時段暴跌超過 17%。
心得/評論:
github
https://github.com/deepseek-ai/Janus
https://arxiv.org/abs/2410.13848
github與論文
解決了多模態模型中,視覺理解與生成之間的衝突
去年已經發布過1.3B的模型,就有不少人覺得在理解prompt和圖片辨識方面很有潛力
現在最新的pro 7b還有待測試
不知道對市場的影響如何,但openai的dalle本來就蠻爛的
作者: event1408472 (醒世明燈)   2025-01-28 04:02:00
殺招都是一招接一招 直接把你打到反擊不能新領導人上來 先給你下馬威
作者: qwer31415926 (qwer314159265)   2025-01-28 06:25:00
作者: silentforest (應該如此)   2025-01-28 07:03:00
不留活路阿
作者: floatbear227 (what love is)   2025-01-28 07:04:00
如果DS有GB系列是否AI會更強大
作者: jceefailurer (阿爸喂)   2025-01-28 07:16:00
救我
作者: dongdong0405 (聿水)   2025-01-28 07:24:00
哈繼續殺
作者: redbeanbread (尋找)   2025-01-28 07:35:00
碼農活該啊 被自己寫的淘汰
作者: loopdiuretic (環利尿劑)   2025-01-28 08:24:00
太無情了
作者: humorforever (~~悠閒過人生~~)   2025-01-28 08:37:00
果然是血汗公司,不給員工過節,台獨又贏麻了
作者: doomsday0728 (朝霧竹炭水)   2025-01-28 09:18:00
7b算了吧 錯誤率墾丁高
作者: BruceChen227 (BruceChen0227)   2025-01-28 09:34:00
完辣

Links booklink

Contact Us: admin [ a t ] ucptt.com