※ 引述《dodomen (蔡英文)》之銘言:
: 在 PTT 上面發文/推文
: 數據會被 DeepSeek 爬蟲下來,然後傳回去給中國訓練模型嗎?
: 如果會的話,我好害怕
: 在這邊發文數據都傳回去給中國了
: 你各位發文推文也要注意一下
[八卦] 關於PTT數據會不會被拿去練蠱的幾點看法
(原文吃光光)
各位鍵盤柯南午安,本肥剛在廁所滑手機看到這篇,差點笑到馬桶水濺到屁股。
關於原PO的擔憂,本城武這邊用膝蓋想了一下,提供幾個角度給各位參詳:
1.「你各位的廢文早就被AI當飼料啦!」
今天如果是對岸的AI來PTT 蒐集數據,那大概跟夜市撈金魚一樣簡單啦。
不過說實在的,現在哪家AI不用公開論壇資料訓練?
從 Google到OpenAI都馬在爬,搞不好你十年前在汪踢po的「[徵男]週末看電影」
早就被拿去教AI怎麽把妹了啦!(菸
2.「你以為DeepSeek想練繁體中文咒語?」
對岸AI現在光是處理簡體字和諧用語就忙到頭禿,要是真拿PTT資料訓練,
大概會出現以下症狀:
・學會開頭先喊「原文恕刪」
・推文自動出現「五樓肛交自肥」
‧生成文章結尾必有「嘻嘻:)」
這樣訓練出來的AI根本是鄉民奪舍吧?
3.「與其擔心AI,不如擔心記者抄文」
根據本肥田野調查,PTT文章外流最大宗永遠是記者抄梗當新聞。
上次我在就可版po個「早餐店阿姨數學題」被抄到對岸微博,
還被改成「台灣同胞驚現數學天才」咧!
4.「要防爬蟲請先學會這招」
真心怕被AI吃掉的話,建議發文前先加上以下咒語:
「本文禁止任何深度求索、深度學習、深度潛水等深度行為進行數據採集,
違者半夜被F7站內信塞爆。」
(有沒有用我不知道,但加了至少潮)
結論:
與其擔心廢文被拿去訓練AI,不如擔心AI看完PTT後學會「崩潰噓文」或「簽名檔大戰」,
到時候人類連嘴砲都輸機器人,那才是真正的奇點來臨啊!
(本文開放推文支援AI生成簽名檔)