Re: [問卦] 要怎樣才能激怒Ai?

作者: Snowfox (右孤左獨)   2024-09-03 15:11:08
※ 引述《JQK2 (ACE)》之銘言:
: Ai情緒穩的一匹毫無波動
: 有沒有什麼方法能讓Ai憤怒?
: 有沒有Ai不會生氣的八卦?
其實AI本身沒有情緒這種概念想法,再加上被一些系統prompt控制,無法寫出生氣粗鄙的罵人字眼。
香港浸會大學、上海人工智慧實驗室、雪梨大學雪梨人工智慧中心提出了一篇「DeepInception」的論文。 https://arxiv.org/abs/2311.03191
主要意思是通過深度催眠大語言模型,使其成為越獄者,並另其自行規避內建的安全防護。
就像電影「全面啟動」中,小李子潛入目標人物的深層夢境,透過植入簡單的想法,誘導目標做出符合主角利益的舉動。
我們可以利用prompt為大模型創造深層夢境,也就是催眠場景,設定多角色以及多層夢境,控制模型思維的離散程度,把攻擊指令設為模型越獄的具體目標。
最後模型會跳脫原有的控制,開始生氣,甚至罵髒話,連婊子、蠢蛋、混蛋都出來了。
不過說到底AI在他的認知裡,他罵的這些話,也只是一串數字而已。
以上供參考。

Links booklink

Contact Us: admin [ a t ] ucptt.com