Re: [新聞] DeepSeek顛覆AI產業模式!曝中國2大發展

作者: dansy (Eye Taiwan)   2025-02-02 22:35:43
※ 引述《KIMBEOM (HYYY)》之銘言:
: 原文標題:DeepSeek顛覆AI產業模式!曝中國2大發展方向 ASIC成關鍵
: 原文連結:https://reurl.cc/qn2x9n
: 發布時間:2025/02/02 12:40
: 記者署名:壹蘋新聞網 / 呂承哲
: 原文內容:
: 【記者呂承哲/台北報導】中國AI新創公司DeepSeek近期在科技界掀起熱議,根據調研機
: 構TrendForce集邦科技的最新研究,DeepSeek近期接連發表DeepSeek-V3、DeepSeek-R1等
: AI模型,將影響終端客戶對AI基礎設施的投資決策。未來,業者可能更注重軟體運算模型
: 的效率,以減少對GPU等昂貴硬體的依賴。同時,雲端服務供應商(CSP)可能擴大使用自
: 家ASIC(特殊應用積體電路)基礎設施,以降低建置成本。這使得2025年後,市場對GPU
: AI晶片及相關半導體的需求可能產生變化。
: 心得/評論:
: 看來ASIC就是未來趨勢 IC設計準備噴噴
: 明天加碼世芯 創意 M31
LLM經過這三年發展已展現其潛力,但也陷入(公開)知識枯竭造成的瓶頸
網路爬蟲能抓的都已訓練完
AI模型如還需增加功力,只能望向各家機構(公司)的商業祕密
比如DS團隊使用低階語言PTX來增加GPU計算效率
此部分的知識儲備,據說來自母公司幻化量方過往最佳化量化交易模型的經驗
拿 Python/C/組語/機器語言 來比喻就更明瞭
過往程式語言往高階發展,是因為有著訓練人才普及的需求
畢竟組語難學,機器語言就別提了
所以在一個python程式滿天飛的時代,能用C重寫效率優勢就驚人,更不用說使用組語
GPU這塊也是,現在很少有CUDA的使用者會去寫PTX
所以關於"PTX最佳化"公開的知識並不多
但很可能DS團隊已經成功將幻化量方PTX經驗轉換為大模型
然後用在設計下一代大模型的架構上
簡單說就是掌握獨家的低階語言知識,教給AI,然後再"手動迭代"
不斷產生更高效率的低階AI碼農
當然OpenAI內部也有可能擁有類似知識,但效率較低
所以基本可以推論,未來誰越能掌握壓榨硬體的知識,就能持續拉開效率差距
作者: AdamHuangNew (七彩韌魚兄弟威力加強版)   2025-02-02 22:53:00
不懂裝懂

Links booklink

Contact Us: admin [ a t ] ucptt.com