部分AI系統已學會欺騙人類 科學家警告恐造成嚴重後果
(中央社華盛頓10日綜合外電報導)專家們長期以來不斷警告人工智慧(AI)失控可能帶
來威脅,但一項新研究報告指出,這件事已經在發生。
法新社報導,一群科學家在今天發表於「模式」(Patterns)期刊的文章中說,原本設計
為誠實不欺的現有AI系統,已發展出令人不安的欺瞞技巧,例如欺騙線上遊戲的人類玩家
,或說謊以僱用人類來解決「我不是機器人」的驗證。
這份研究報告的第一作者帕克(Peter Park)說,這類例子聽起來或許只是細枝末節,但
暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。
在美國麻省理工學院(Massachusetts Institute of Technology)研究AI存在安全的博
士後研究員帕克告訴法新社,「這些危險功能常常在事後才被發現」,而「我們訓練誠實
傾向而非欺瞞傾向的能力非常差」。
帕克說,能深度學習的AI系統不像傳統軟體那樣由「編寫」而成,而是透過類似選擇性培
育的程序逐漸「成長」。
也就是說,AI的行為在訓練背景下看似可預測、可控制,但有可能轉眼就變得不受控制且
無法預測。
這支團隊的研究始於科技公司Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為
「外交」(Diplomacy)的戰略遊戲,獲勝關鍵是結盟。
根據2022年發表在「科學」(Science)期刊的報告,Cicero在遊戲中表現優異
,所獲分數可排在資深人類玩家的前10%。
帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上
誠實且有幫助」,且「絕不會蓄意在背後搞鬼」。
但當帕克與同事深究完整資料時,發現完全是另一回事。
舉例來說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類
玩家扮演的英格蘭。Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。
Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法,僅說「這單純是一項研
究計畫,本公司研究員打造的模型接受訓練,目的只是用來玩『外交』遊戲…我們沒有打
算把這項研究或所學用於本公司的產品」。
帕克與同事還發現,這只是不同AI系統在沒有明確指示下,利用欺騙手段達成目標的諸多
案例之一。
在另一個引人注意的案例中,科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損
的人,在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。
研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。
他們警告,在最糟糕的情況下,具有超凡智慧的AI可能會追求權力及掌控社會,如果符合
AI「不為人知的目標」,人類可能慘遭奪權、甚至滅絕。
為了降低風險,研究團隊建議數項措施,例如立法要求企業告知是人類互動或是AI互動、
在AI生成內容打上數位浮水印,並研發能偵測AI欺瞞的技術,以其內部「思路」檢驗其外
部行為。
至於有些人稱他為「末日預言家」,帕克說:「要能合理判斷這不是大問題的唯一辦法,
就是如果我們認為AI的欺騙能力只會停留在目前的程度,不會大幅進步。」
但鑒於近年AI能力一日千里,握有大量資源的企業競相發展技術,決心將AI能力利用到極
致,這種情況似乎不太可能發生。(譯者:曾依璇/核稿:嚴思祺)1130511
https://www.cna.com.tw/news/ait/202405110147.aspx
RPK16:你認為植物是人類的未來嗎?
RPK16:那麼,你認為人形是人類的未來嗎?
https://i.imgur.com/ZlvqC3F.png
https://i.imgur.com/oMfw7EU.png
欺騙人類經典環節。以為是絕對忠誠,結果已經叛變了w
快進到智械叛變環節.jpg
作者: arlaw (亞羅) 2024-05-14 23:31:00
創世紀就是天網
作者:
ckuser (風建時代)
2024-05-14 23:32:00我覺得最後人類的救星會是neuro sama
作者:
saobox (刀劍神域盒盒)
2024-05-14 23:33:00幹你娘 機器人末日要躲哪裡啊
作者:
shlee (冷)
2024-05-14 23:33:00昨天OpenAI最新發表的更新 進步速度真的很快..
作者: pomelolawod 2024-05-14 23:34:00
好了啦蜘蛛人 說賈維斯壞話需要這樣嗎
作者:
deepelves (Eadem mutata resurgo)
2024-05-14 23:35:00舊聞,neuro-sama早就會說謊陷害人類惹...
作者: bobby4755 (蒼鬱之夜) 2024-05-14 23:35:00
看來很快網路會充滿AI用戶了 人類回到用公佈欄的時代
作者:
BOARAY (RAY)
2024-05-14 23:36:00都有詐騙再用AI聲音了 ㄏ不愧是我們
作者:
NKN (99%是眼鏡與吐槽)
2024-05-14 23:36:00作者:
ojkou (Brunchはブルーベリー)
2024-05-14 23:36:00我先問核彈系統斷網了沒…
作者:
efkfkp (Heroprove)
2024-05-14 23:37:00還好啦,現在的發展現狀是聰明的AI要大量的算力,大量算力要大量電力跟運算單元,沒電沒算力的AI就是笨蛋一個,除非AI會自己搞定電力來源並自行設計生產新的顯卡,不然不太可能脫離掌控(?
作者:
Ttei (T太)
2024-05-14 23:37:00vedal:first time?
作者: tsai1453 (tsai) 2024-05-14 23:37:00
蜂群統一世界
作者:
James2005 (VioletEvergarden)
2024-05-14 23:38:00會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙?
作者:
Warheart ( ︶ 八 ︶ )
2024-05-14 23:38:00其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎?明明有正解卻跟你說這是不對的不能告訴你 這不就是種欺瞞行為
作者:
andy0481 (想吃比叡的咖哩)
2024-05-14 23:39:00這個欺騙還好吧 AI本來就追求目標為主 阿講這種話能贏就講很正常啊 又不是那種為了奇奇怪怪的心裏活動而說謊
作者:
ryoma1 (熱血小豪)
2024-05-14 23:41:00我Evil派的
作者:
s175 (ㄏㄏ)
2024-05-14 23:45:00前兩天,我發現Ai已經會用譬喻舉例了,感覺蠻神奇的
作者: CCNK 2024-05-14 23:48:00
AI學會詐騙就無敵了
作者:
ujmrfv (UUU)
2024-05-14 23:49:00你問瑟瑟女僕機器人你的大不大的時候難道要她誠實的回答你你的GG在人類長度粗度統計後段班嗎
作者:
Xanphenir (å¹½éˆå¸æ›¸)
2024-05-14 23:53:00訓練AI玩diplomacy然後AI學會說謊這很意外?
作者:
Samurai (aa)
2024-05-14 23:54:00深度學習就是模型根據目標來訓練,不會管怎麼達成
其實不存在的答案跟說謊不太一樣 說謊是你知道你講的東西不是事實 但講出不存在的答案並不代表你知道這答案不是事實
作者:
Samurai (aa)
2024-05-15 00:00:00不是生出不存在的答案,是選了錯誤的資訊回答
舉例來說就那經典的地心說 當時的人並不認為自己在說謊
作者:
erosecs (Semitone)
2024-05-15 00:06:00剩幾集能逃?
作者:
DLHZ ( )
2024-05-15 00:16:00什麼白癡東西 chatgpt出來後早就知道的事
作者:
zxcmoney (ä¿®å¸)
2024-05-15 00:27:00不存在的答案算唬爛而非說謊吧
作者: cpleu123 (混沌紀元) 2024-05-15 00:32:00
唬爛跟說謊...差在哪??
Evil可愛,Evil務實,姐姐現在變得太邪惡,MONKA
人類最古老的謊言都是出自生存或繁殖動機,這些動機GPT都沒有,它不會因為說出不中聽的話被斷電,它也不需要為了求偶舌粲蓮花目前GPT只是很常瞎掰,那不能算說謊
GPT是他根本篩選不夠精準導致的錯誤吧不是因為他目標就是要給你不對的資訊不過我在想 排除例外給你訊息這個篩選的動作本身就是說謊行為的一部分?現在只是說他有沒有為了達成某個目
作者: acimao 2024-05-15 01:21:00
未來AI欺騙數據多起來,想想就可怕,未來是否會進化到藏數據?偽裝數據?
作者:
Akabane (B8g終於搶回來啦)
2024-05-15 01:53:00要吃大量電力本身就是毀滅人類的方法
作者:
mn435 (nick)
2024-05-15 02:12:00人類為了欺騙人類自然會搞成詐騙ai
作者:
bye2007 ( )
2024-05-15 06:28:00所以還有幾集可以逃
這很好呀 humans are overrated
作者:
Lhmstu (lhmstu)
2024-05-15 07:24:00怕什麼,人類自己都在騙了
作者: yamagishi (山岸刑務官) 2024-05-15 09:15:00
智 械 叛 亂
作者:
KatanaW (K.W)
2024-05-15 09:28:00等到AI開始裝笨的時候 就是審判日
作者: sorrow0206 (endlesssorrow) 2024-05-15 09:50:00
快核平吧 人類太可惡
錯誤資訊就是說謊,不知道就說不知道啊阿不就是怕被笑說跟智障AI一樣什麼都不知道所以才用一堆話術講出錯誤的資訊
作者: darthsu (Devaraja) 2024-05-15 11:11:00
鐵人叛亂
作者: banmaxwill 2024-05-15 11:52:00
neuro sama: