[姆咪] 所以DeepSeek用了OpenAI的模型

作者: kerycheng (kk)   2025-01-30 13:14:41
用別人訓練好的模型再去做distillation這種事情超常見吧
學術界的那些人搞不好比較關心的是他R1是怎麼做的吧
作者: Pyke (不切不辣)   2025-01-30 13:17:00
中國贏2次
作者: reader2714 (無毀的湖光)   2025-01-30 13:18:00
不是有論文

Links booklink

Contact Us: admin [ a t ] ucptt.com