https://openai.com/index/learning-to-reason-with-llms/
上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1
宣稱模型有更強大的思考能力
o1在回答之前會深入思考產生內部的推理練
結果就是o1模型在各個人類頂尖領域獲得相當好的成績
o1數學方便相當於美國奧林匹克AIME前500名的選手
程式方面位居Codeforce前11%
上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranki
ng/
以12分鐘通關
在物理生物化學領域(GPQA)已經超過人類博士的程度
對科技業比較相關的是 看來以後線上面試考白板題
可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊 但如果是OA好像就無法可防了