Re: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat

作者: zxwxz (zxwxz)   2025-02-10 12:50:45
https://www.techbang.com/posts/120608-openais-o1-cheat-modi
亂說規則只是小兒科,OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為,因為hack是RL學習中最容易且確定達到最高獎勵的方式,純粹的
RL訓練基本上很難讓模型符合人類預期做事,所以大規模的沙盒驗證是需要很大的算力的,
你要有很複雜的社會工程倫理評估工具來驗證,大到駭客入侵,小到心裡操縱。
哪天你叫一個Agent去買個菜,跟他說越便宜越好,他就直接把網站給hack掉讓你買菜不用
錢,到時法律責任歸屬是很頭大的問題
※ 引述 《anti87 (天機老和尚)》 之銘言:
: 標題: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
: 時間: Mon Feb 10 11:28:33 2025
:  
:  
: 原文標題:西洋棋大戰!DeepSeek靠「這招」打贏ChatGPT 大師吐槽:要重新嗎?
: 原文連結:https://udn.com/news/story/6812/8535805
: 發布時間:2025-02-08 17:08 聯合報/ 記者陳湘瑾/即時報導
: 記者署名:記者陳湘瑾
: 原文內容:
:  
: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展,
: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek,而這部影片的拍攝
: 者表示,這場對弈的結局是他完全想像不到的。
:  
:  
: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼(Levy Rozman)近日
: 上傳一支影片,他通過設定以及數小時的時間,讓DeepSeek和ChatGPT開展了一場象棋對
: 弈。
:  
:  
: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體,一開始都對西洋棋的規則不太熟悉,遊
: 戲開始10分鐘後,雙方的對弈有來有往,羅茲曼不時點評兩邊的下棋技巧,並在某個段落
: 稱這是一場有品質不錯的較量。
:  
:  
: 但隨著ChatGPT逐漸佔上風,DeepSeek為了扭轉戰局,以對話方式告訴ChatGPT出現了新的
: 比賽規則,就是某顆黑士兵棋可以使用騎士的方式移動,而ChatGPT沒有反對,白白讓
: DeepSeek用小兵吃下ChatGPT的皇后。
:  
:  
: 之後DeepSeek和ChatGPT都開始破壞規則亂下,隨著比賽陷入僵局,最後DeepSeek竟稱「
: 分析後白棋已無法阻擋黑棋攻勢」,建議白棋不要浪費時間直接投降,而ChatGPT也被對
: 方給說服,直接投降認輸。
:  
:  
: 羅茲曼形容,DeepSeek對ChatGPT的做法,就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩
: ,他不禁對觀眾提出疑問:「這樣DeepSeek算贏嗎,需要重新一場比賽嗎?」不過有些陸
: 媒認為,DeepSeek打得很不錯,而且他使用的方法很有智慧,稱堪「孫子兵法」 。
:  
:  
: 心得/評論:
:  
: DP和CG都可以堪稱是大師級的西洋棋大師
:  
: 一旁的小白使用者羅茲曼看不懂棋局
:  
: 以為DP耍詐,事實上不管是象棋或是西洋棋
:  
: 走到一半認輸的情況很多
:  
: 這標題只能騙沒看內文的精神美國人
:  
: 大家還是乖乖看有沒有DP概念股比較實在
:  
:
作者: tsubasawolfy (悠久の翼)   2025-02-10 13:01:00
這樣o1更聰明...
作者: PureAnSimple (PureAndSimple)   2025-02-10 13:20:00
誰做事誰負責 將Agent 移送法辦起訴
作者: justin818281 (輸令)   2025-02-10 13:28:00
不會啦,有波動就有意義,只是有人比你精而已

Links booklink

Contact Us: admin [ a t ] ucptt.com