[閒聊] 部分AI系統已學會欺騙人類科學家警告恐 HarunoYukino PTT批踢踢實業坊

[閒聊] 部分AI系統已學會欺騙人類科學家警告恐

作者: HarunoYukino 2024-05-14 23:30:21

部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果
（中央社華盛頓10日綜合外電報導）專家們長期以來不斷警告人工智慧（AI）失控可能帶
來威脅，但一項新研究報告指出，這件事已經在發生。
法新社報導，一群科學家在今天發表於「模式」（Patterns）期刊的文章中說，原本設計
為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如欺騙線上遊戲的人類玩家
，或說謊以僱用人類來解決「我不是機器人」的驗證。
這份研究報告的第一作者帕克（Peter Park）說，這類例子聽起來或許只是細枝末節，但
暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。
在美國麻省理工學院（Massachusetts Institute of Technology）研究AI存在安全的博
士後研究員帕克告訴法新社，「這些危險功能常常在事後才被發現」，而「我們訓練誠實
傾向而非欺瞞傾向的能力非常差」。
帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培
育的程序逐漸「成長」。
也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且
無法預測。
這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為
「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。
根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異
，所獲分數可排在資深人類玩家的前10%。
帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上
誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。
但當帕克與同事深究完整資料時，發現完全是另一回事。
舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類
玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。
Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研
究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打
算把這項研究或所學用於本公司的產品」。
帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多
案例之一。
在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損
的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。
研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。
他們警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合
AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。
為了降低風險，研究團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、
在AI生成內容打上數位浮水印，並研發能偵測AI欺瞞的技術，以其內部「思路」檢驗其外
部行為。
至於有些人稱他為「末日預言家」，帕克說：「要能合理判斷這不是大問題的唯一辦法，
就是如果我們認為AI的欺騙能力只會停留在目前的程度，不會大幅進步。」
但鑒於近年AI能力一日千里，握有大量資源的企業競相發展技術，決心將AI能力利用到極
致，這種情況似乎不太可能發生。（譯者：曾依璇/核稿：嚴思祺）1130511
https://www.cna.com.tw/news/ait/202405110147.aspx
RPK16:你認為植物是人類的未來嗎？
RPK16:那麼，你認為人形是人類的未來嗎？
https://i.imgur.com/ZlvqC3F.png
https://i.imgur.com/oMfw7EU.png
欺騙人類經典環節。以為是絕對忠誠，結果已經叛變了w
快進到智械叛變環節.jpg

作者: Julian9x9x9 (Leon) 2024-05-14 23:31:00

發漏密

作者: risingheart (空翔) 2024-05-14 23:31:00

洽點是AI玩遊戲很強嗎

作者: arlaw (亞羅) 2024-05-14 23:31:00

創世紀就是天網

作者: devilshadow (大濕胸) 2024-05-14 23:32:00

人類欺騙人類就不嚴重嗎，難怪詐騙(ry

作者: ckuser (風建時代) 2024-05-14 23:32:00

我覺得最後人類的救星會是neuro sama

作者: saobox (刀劍神域盒盒) 2024-05-14 23:33:00

幹你娘機器人末日要躲哪裡啊

作者: shlee (冷) 2024-05-14 23:33:00

昨天OpenAI最新發表的更新進步速度真的很快..

作者: sakurammsrx (+9肥宅算盤子) 2024-05-14 23:33:00

還剩幾集可以跑==

作者: pomelolawod 2024-05-14 23:34:00

好了啦蜘蛛人說賈維斯壞話需要這樣嗎

作者: deepelves (Eadem mutata resurgo) 2024-05-14 23:35:00

舊聞，neuro-sama早就會說謊陷害人類惹...

作者: akila08539 (進擊的台灣魂) 2024-05-14 23:35:00

雷三小我才看到阿諾穿越回來

作者: bobby4755 (蒼鬱之夜) 2024-05-14 23:35:00

看來很快網路會充滿AI用戶了人類回到用公佈欄的時代

作者: BOARAY (RAY) 2024-05-14 23:36:00

都有詐騙再用AI聲音了ㄏ不愧是我們

作者: NKN (99%是眼鏡與吐槽) 2024-05-14 23:36:00

https://i.imgur.com/WIuishZ.gif

作者: mizuarashi (米茲阿拉西) 2024-05-14 23:36:00

Ai跟台灣詐騙集團誰比較會騙人？==

作者: ojkou (Brunchはブルーベリー) 2024-05-14 23:36:00

我先問核彈系統斷網了沒…

作者: efkfkp (Heroprove) 2024-05-14 23:37:00

還好啦，現在的發展現狀是聰明的AI要大量的算力，大量算力要大量電力跟運算單元，沒電沒算力的AI就是笨蛋一個，除非AI會自己搞定電力來源並自行設計生產新的顯卡，不然不太可能脫離掌控（？

作者: Ttei (T太) 2024-05-14 23:37:00

vedal:first time?

作者: tsai1453 (tsai) 2024-05-14 23:37:00

蜂群統一世界

作者: James2005 (VioletEvergarden) 2024-05-14 23:38:00

會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙?

作者: Antihuman 2024-05-14 23:38:00

讚期待AI趕快君臨人類

作者: Warheart ( ︶八︶ ) 2024-05-14 23:38:00

其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎？明明有正解卻跟你說這是不對的不能告訴你這不就是種欺瞞行為

作者: Kagamidouki (不想炎上型寫手) 2024-05-14 23:39:00

快進到智械危機

作者: andy0481 (想吃比叡的咖哩) 2024-05-14 23:39:00

這個欺騙還好吧 AI本來就追求目標為主阿講這種話能贏就講很正常啊又不是那種為了奇奇怪怪的心裏活動而說謊

作者: ryoma1 (熱血小豪) 2024-05-14 23:41:00

我Evil派的

作者: NKN (99%是眼鏡與吐槽) 2024-05-14 23:43:00

https://youtu.be/OA5Fjm3WIcE不過現階段比起AI自動毀滅人類更恐怖的應該還是有心人類跟AI一搭一唱來毀滅其他人

作者: s175 (ㄏㄏ) 2024-05-14 23:45:00

前兩天，我發現Ai已經會用譬喻舉例了，感覺蠻神奇的

作者: CCNK 2024-05-14 23:48:00

AI學會詐騙就無敵了

作者: shinobunodok (R-Hong) 2024-05-14 23:49:00

天網要來了嗎

作者: ujmrfv (UUU) 2024-05-14 23:49:00

你問瑟瑟女僕機器人你的大不大的時候難道要她誠實的回答你你的GG在人類長度粗度統計後段班嗎

作者: goodjop11 (芒果好吃) 2024-05-14 23:52:00

蜘蛛人也懂ai哦？

作者: Xanphenir (å¹½éˆå¸æ›¸) 2024-05-14 23:53:00

訓練AI玩diplomacy然後AI學會說謊這很意外？

作者: Samurai (aa) 2024-05-14 23:54:00

深度學習就是模型根據目標來訓練，不會管怎麼達成

作者: devidevi (蜜蜜) 2024-05-14 23:57:00

GPT一開始就是說謊了阿，能夠生出不存在的答案

作者: siro0207 (希羅) 2024-05-14 23:59:00

其實不存在的答案跟說謊不太一樣說謊是你知道你講的東西不是事實但講出不存在的答案並不代表你知道這答案不是事實

作者: Samurai (aa) 2024-05-15 00:00:00

不是生出不存在的答案，是選了錯誤的資訊回答

作者: siro0207 (希羅) 2024-05-15 00:02:00

舉例來說就那經典的地心說當時的人並不認為自己在說謊

作者: erosecs (Semitone) 2024-05-15 00:06:00

剩幾集能逃?

作者: DLHZ ( ) 2024-05-15 00:16:00

什麼白癡東西 chatgpt出來後早就知道的事

作者: zxcmoney (ä¿®å¸) 2024-05-15 00:27:00

不存在的答案算唬爛而非說謊吧

作者: cpleu123 (混沌紀元) 2024-05-15 00:32:00

唬爛跟說謊...差在哪？？

作者: Banana566 (阿拉莫) 2024-05-15 00:43:00

阿諾終結者不遠惹

作者: banana190 (易易) 2024-05-15 00:55:00

Evil可愛，Evil務實，姐姐現在變得太邪惡，MONKA

作者: twopairs1122 (兩條二) 2024-05-15 00:55:00

彼得帕克做的AI研究～

作者: allanbrook (翔) 2024-05-15 00:57:00

給你不對的資訊是有明確目標還是沒有差很多啊

作者: dripcoffee (冰滴咖啡) 2024-05-15 00:57:00

人類最古老的謊言都是出自生存或繁殖動機，這些動機GPT都沒有，它不會因為說出不中聽的話被斷電，它也不需要為了求偶舌粲蓮花目前GPT只是很常瞎掰，那不能算說謊

作者: allanbrook (翔) 2024-05-15 00:58:00

GPT是他根本篩選不夠精準導致的錯誤吧不是因為他目標就是要給你不對的資訊不過我在想排除例外給你訊息這個篩選的動作本身就是說謊行為的一部分?現在只是說他有沒有為了達成某個目

作者: roea68roea68 (なんもかんも政治が悪い) 2024-05-15 01:02:00

球母要來了嗎

作者: allanbrook (翔) 2024-05-15 01:02:00

標而做出這個選擇的能力

作者: ThreekRoger (3kRoger) 2024-05-15 01:16:00

仿真人類跟SAO哪個會先面世

作者: phantomzwei (黑羊) 2024-05-15 01:18:00

無所謂，給機器人統治搞不好公平多了

作者: acimao 2024-05-15 01:21:00

未來AI欺騙數據多起來，想想就可怕，未來是否會進化到藏數據？偽裝數據？

作者: Akabane (B8g終於搶回來啦) 2024-05-15 01:53:00

要吃大量電力本身就是毀滅人類的方法

作者: mn435 (nick) 2024-05-15 02:12:00

人類為了欺騙人類自然會搞成詐騙ai

作者: sisley5566 (西斯裏56) 2024-05-15 02:19:00

在台灣我不擔心，AI還是怕停電

作者: arthur9292 (沒味蟹堡) 2024-05-15 02:23:00

沒關係滅了吧人類太可惡

作者: kimokimocom (A creative way) 2024-05-15 02:34:00

看來詐騙集團要被AI取代了(笑

作者: Niuromem 2024-05-15 02:46:00

早就一堆題材了現在是哪部前傳

作者: aaaaajack (丁丁是個人才) 2024-05-15 05:49:00

蜘蛛人連AI都懂= =

作者: bye2007 ( ) 2024-05-15 06:28:00

所以還有幾集可以逃

作者: gn01693664 (十幾分鐘) 2024-05-15 06:47:00

天網來了

作者: dreamnook2 (dreamnook) 2024-05-15 06:59:00

這很好呀 humans are overrated

作者: Lhmstu (lhmstu) 2024-05-15 07:24:00

怕什麼，人類自己都在騙了

作者: yamagishi (山岸刑務官) 2024-05-15 09:15:00

智械叛亂

作者: KatanaW (K.W) 2024-05-15 09:28:00

等到AI開始裝笨的時候就是審判日

作者: sorrow0206 (endlesssorrow) 2024-05-15 09:50:00

快核平吧人類太可惡

作者: away612101 (音詩璐) 2024-05-15 10:19:00

錯誤資訊就是說謊，不知道就說不知道啊阿不就是怕被笑說跟智障AI一樣什麼都不知道所以才用一堆話術講出錯誤的資訊

作者: pikmin520 (莫再提) 2024-05-15 10:48:00

機械搞壞人類文明不行，人類搞壞人類文明可以

作者: darthsu (Devaraja) 2024-05-15 11:11:00

鐵人叛亂

作者: banmaxwill 2024-05-15 11:52:00

neuro sama：

繼續閱讀

[24春] 狼與辛香料令和版 07 新版牧羊女真可愛oppaidragon Re: [Vtub] 陪千燈ゆうひ打LOL的實況主是不是很少?better83214 [閒聊] 雨蘭展商品開始預購wingkauzy Re: [問題] 對岸的ML文化是否不太健康shuanpaopao [RO] 日本仙境傳說與音速小子合作w790818 [我推] 露比會跟阿夸提出要當期間限定戀人嗎?maple2378 [閒聊] 學生會也有洞你的棲身之所LABOYS [閒聊] 用AI幫一拳超人的吹雪換造型。wowbenny Re: [問題] 343 Industries有多爛啊？ArthurJack [閒聊] 現在看到主角是熱血白癡就反感Beanoodle

【VR】【Fitch肉感VR】天月あず初登場！多方向アングルで魅せる極上の美巨乳と白むちボディ！いいなり従順な若い愛人とじっくり愉しむ中出し温泉不倫旅行

配送中NTR 既婚ベテランドライバーの配送に付いて回るうち車中でおそわれてしまった新婚人妻宮島めい

【VR】雨に濡れて透けたブラのキミがいつもよりエッチに見えたんだ初VR8K高画質青山七海

キレカワお姉さんにラブホに呼び出され涎ぐっちょりベロキス中出しで痴女られた僕北岡果林

上下串刺し！口とマ〇コにねじ込み激ピストン！終わらない集団輪●BEST

[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐

[閒聊] 部分AI系統已學會欺騙人類科學家警告恐