1.媒體來源:
新頭殼
2.記者署名:
楊清緣 綜合報導
3.完整新聞標題:
親中搞雙標?「China breaks promise」Google翻譯:中國信守諾言
4.完整新聞內文:
https://i.imgur.com/ysiVDoJ.png
搜尋引擎Google的Google Translate被許多人使用翻譯外國語言,但卻被網友揪出一句離
譜的「雙重標準」翻譯錯誤。臉書粉專「前線科技人員」指,17日網上瘋傳Google
Translat把「China breaks promise(中國破壞承諾)翻譯成「中國信守諾言」,但「
US breaks promise(美國破壞承諾)」就會翻譯做「美國違約」。不過,專家指出,這
可能是某一國家或某種語言媒體經常將China breaks promise在網路上刻意翻譯成「中國
信守諾言」,才導致Google Translate鬧出「親中搞雙標」的笑話。
經實測,各種語言的「中國破壞承諾」都會被Google Translate翻譯成「中國信守諾言」
,若把台灣、香港、澳門替換中國兩字,也會出現同樣錯誤情況。而Google翻譯並非首次
出錯,前年反送中運動其間,有香港網友發現將「so sad to see Hong Kong became
China(我很難過看到香港變成中國)」翻譯成中文時, Google竟翻譯成「很高興看到香
港成為中國」。Google發言人當時向法新社說明,由於使用自動系統,有時會出現無心錯
誤,例如把負面譯成正面字眼。
據了解,Google Translate原理是放棄文法,純粹用網上大量數據建立模型,而其數據資
料庫大部份資料均從公開途徑獲得。當時就有網友分析,問題不是出在Google,而是有人
惡意引導。Google的搜尋跟翻譯後面都是透過特定演算法去處理,去年曾有發生過,在
Google圖片搜尋「白癡」,會跑出川普的照片,是因為有特定團體通過在川普的照片標注
白癡所造成。而Google翻譯問題也是用「類似的手法」,加入 Google的翻譯社群,然後
多次給予特定句子錯誤的翻譯,最後讓所有人在輸入特定句子時,跑出主導者所想要的結
果。
「前線科技人員」專頁解釋,幾十年前舊式電腦翻譯主要方法是教電腦程式辨認不同文法
,但由於人類語言文法有大量例外用法,令效果一直強差人意。近十多年來Machine
Learning(機器學習)開始普及,研究人員開始循另一個方向解決電腦翻譯問題,嘗試放
棄文法,純粹用大量數據去建立模型,事實證明效果比傳統方法更好。但Google的數據庫
大部份資料從公開途徑獲得,如果某一國家或某種語言媒體經常將China breaks promise
在網路上翻譯成「中國信守諾言」,大量假資料就會造成AI誤判進而讓Google Translate
出包。
5.完整新聞連結 (或短網址):
https://newtalk.tw/news/view/2021-01-18/524804
6.備註: