[問卦] 通用人工智慧(AGI)是不是快了? tsubasawolfy PTT批踢踢實業坊

[問卦] 通用人工智慧(AGI)是不是快了?

作者: tsubasawolfy (悠久の翼) 2024-12-21 07:25:19

剛剛看完OPEN AI憋了12天的壓箱寶影片
https://youtu.be/SKBG1sqdyIU
提到已經完成最新的 O3推理模型
寫程式方面輾壓現在開放給大眾用的最強的O1，
而且分數(2727)還比畫面上白衣服那位(2500)跟它們團隊首席科學家高XD
https://i.imgur.com/oV8surS.png
給他做美國數學奧林匹亞測試是96.7分，剩下的3.3分是因為有一題總是會算錯
博士等級的科學問題看起來是沒領先O1太多
https://i.imgur.com/CgnjplM.png
研究型的數學問題，專門給那些資深數學家去探索的，沒發表過的資料
O3達到25.2%，其他類模型只有2%正確率
https://i.imgur.com/AYcARqi.png
不過最驚訝的是請來外部團體測試AGI的分數
ARC-AGI用像這種圖去測試AI是不是有達到人類推理水準
https://i.imgur.com/jr1rU9j.png
這題比較簡單，就是要把缺的地方填上變成完整正方形
https://i.imgur.com/Jl7fhOS.png
這題難一點，要去算各方形內的點跟辨認顏色
然後在相對應的方形外用該顏色跟數量當寬度去把方形框起來
現在的O1給他足夠時間也只能到32%，O3在低計算環境下有75.7%
如果要O3想久一點的話可以到87.5%
重點是跨過85%這個門檻就算相當於有人類的推理能力
https://i.imgur.com/Gx77oLi.png
好奇去找了一下這測驗對人類難度有多少
2024年紐約大學找了1729人測試，正確率落在73.3%-77.2%
但是98.7%的問題至少有一位普羅大眾可以解完
不過O3目前還沒要釋出，OPEN AI還要幫他加上各種安全裝置
在各種安全裝置下能不能達到基本AGI的水準就是大問號了
人類想創造出接近人類但是又不能超過人類的心理真是奇妙

繼續閱讀

[新聞] 護愛謝克洋「介入立院攻防」？三立女記Workforme [問卦] 為什麼補助私立大學學費也要拿出來說DDDDRR [新聞] 日本2025年元旦新制快速通關台灣旅客率qazsedcft [問卦] 33處男又去象山約妹了嗎?t127147157 Re: [新聞] 找不到人出氣！花蓮「火爆男」竟將情敵胞兄活活打死t19960804 [新聞] 馬英九：兩岸應史無前例大合作呈現日本LIN9 [新聞] 代課男師性侵男童拍影片收押lwt501cx [新聞] 敘利亞新領袖喬拉尼喊話要求以色列撤離spirit119 [新聞] 國民黨羞辱青鳥還嗆「瘋子」！賴清德：人SCHWARZMILCH [問卦] 認真問八卦板為什麼板主不禁政治新聞？kekebunny