[新聞] 拒訓練AI 新聞媒體封殺ChatGPT VVin PTT批踢踢實業坊

[新聞] 拒訓練AI 新聞媒體封殺ChatGPT

作者: VVin (VV) 2023-08-26 23:42:00

拒訓練AI 新聞媒體封殺ChatGPT
https://img.ltn.com.tw/Upload/news/600/2023/08/26/133.jpg
螢幕上顯示生成式人工智慧機器人ChatGPT和開發公司OpenAI的標誌。（法新社檔案照）
2023/08/26 05:30
〔編譯管淑平／綜合報導〕
生成式人工智慧機器人ChatGPT的資料取用愈加受到爭議，包括紐約時報、有線電視新聞
網（CNN）、路透及澳洲廣播公司（ABC）知名新聞機構，都已封鎖開發ChatGPT的OpenAI
，利用網路爬蟲程式擷取其網站內容，用於訓練AI系統。
英國衛報廿五日報導，OpenAI的網路爬蟲程式「GPTBot」會掃描網頁，收集資料，用於AI
大型語言模型以及內容生成。科技媒體「Verge」披露紐時封殺GPTBot的消息後，衛報進
一步發現，包括CNN、路透、芝加哥論壇報、澳洲廣播公司（ABC）和澳洲社區新聞集團（
ACM）也都已禁止網路爬蟲在其網站抓取資料。
從這些網站的robots.txt檔案中可見允許網路爬蟲程式造訪哪些頁面的程式碼。報導指出
，這些新聞媒體都是在八月加入封鎖指令，除了ChatGPT，也不讓同樣用於AI的開放網路
資料庫Common Crawl的網路爬蟲CCBot訪問網頁。
像ChatGPT所用的大型語言模型，仰賴收集龐大資訊來訓練，使其能夠以類似人類語言模
式回答使用者的問題，但是運作這些AI機器人的公司，對於其資料庫中儲存有版權內容的
問題，都緊守口風。
籲為生成式AI制定規範
CNN向澳洲版衛報證實，近期封鎖了GPTBot的訪問權。路透發言人說，「智慧財產是我們
業務的命脈，我們勢必要保護我們的內容版權」。紐時發言人說，網站服務約定條款最近
更新，「更清楚表明禁止抓取我們的內容，用於AI訓練和開發」。
ChatGPT刮起生成式人工智慧機器人旋風後，全球新聞機構都正面臨是否使用人工智慧於
新聞收集，以及其新聞內容可能會被收集用於訓練AI的問題。法新社和Getty Images等新
聞、出版組織日前才簽署公開信，呼籲為生成式AI機器人制定規範，包括「生成AI模型所
用訓練的所有內容透明度」，以及使用有版權內容，須取得版權所有人同意等。
https://news.ltn.com.tw/news/world/paper/1601432

繼續閱讀

[新聞] 普里格津座機非飛彈擊落VVin [新聞] 絕不屈服川普帳號復活首PO口卡照VVin [新聞] 中國放棄清零2個月超額死亡近200萬人VVin [新聞] 菲澳南海兩棲攻擊演習模擬奪島VVin [新聞] 莫習會互釋善意緩和邊境對峙VVin [新聞] 雨水短缺釀乾旱巴拿馬運河限航令維持一年hvariables [新聞] 拜登政府跨大西洋五國商議機制納入義大利hvariables [新聞] 阿根廷入金磚國家政商反應兩樣情hvariables [新聞] 中國債務傳9兆美元壓力大 skyhawkptt [新聞] 沙特要建核電站或以稱采中國競標向美施壓skyhawkptt