[新聞] 拒訓練AI 新聞媒體封殺ChatGPT

作者: VVin (VV)   2023-08-26 23:42:00
拒訓練AI 新聞媒體封殺ChatGPT
https://img.ltn.com.tw/Upload/news/600/2023/08/26/133.jpg
螢幕上顯示生成式人工智慧機器人ChatGPT和開發公司OpenAI的標誌。(法新社檔案照)
2023/08/26 05:30
〔編譯管淑平/綜合報導〕
生成式人工智慧機器人ChatGPT的資料取用愈加受到爭議,包括紐約時報、有線電視新聞
網(CNN)、路透及澳洲廣播公司(ABC)知名新聞機構,都已封鎖開發ChatGPT的OpenAI
,利用網路爬蟲程式擷取其網站內容,用於訓練AI系統。
英國衛報廿五日報導,OpenAI的網路爬蟲程式「GPTBot」會掃描網頁,收集資料,用於AI
大型語言模型以及內容生成。科技媒體「Verge」披露紐時封殺GPTBot的消息後,衛報進
一步發現,包括CNN、路透、芝加哥論壇報、澳洲廣播公司(ABC)和澳洲社區新聞集團(
ACM)也都已禁止網路爬蟲在其網站抓取資料。
從這些網站的robots.txt檔案中可見允許網路爬蟲程式造訪哪些頁面的程式碼。報導指出
,這些新聞媒體都是在八月加入封鎖指令,除了ChatGPT,也不讓同樣用於AI的開放網路
資料庫Common Crawl的網路爬蟲CCBot訪問網頁。
像ChatGPT所用的大型語言模型,仰賴收集龐大資訊來訓練,使其能夠以類似人類語言模
式回答使用者的問題,但是運作這些AI機器人的公司,對於其資料庫中儲存有版權內容的
問題,都緊守口風。
籲為生成式AI制定規範
CNN向澳洲版衛報證實,近期封鎖了GPTBot的訪問權。路透發言人說,「智慧財產是我們
業務的命脈,我們勢必要保護我們的內容版權」。紐時發言人說,網站服務約定條款最近
更新,「更清楚表明禁止抓取我們的內容,用於AI訓練和開發」。
ChatGPT刮起生成式人工智慧機器人旋風後,全球新聞機構都正面臨是否使用人工智慧於
新聞收集,以及其新聞內容可能會被收集用於訓練AI的問題。法新社和Getty Images等新
聞、出版組織日前才簽署公開信,呼籲為生成式AI機器人制定規範,包括「生成AI模型所
用訓練的所有內容透明度」,以及使用有版權內容,須取得版權所有人同意等。
https://news.ltn.com.tw/news/world/paper/1601432

Links booklink

Contact Us: admin [ a t ] ucptt.com