事實上直接以 Google Translation 來看 Google Seq2Seq 的翻譯實力有失公允
神經模型除了要準,還有一件事情非常重要,甚至說是更重要
就是 Inference Cost
https://research.googleblog.com/2016/09/a-neural-network-for-machine.html
Google 在一年前就拿出 GNMT ,在今天這則新聞前,是人工智慧翻譯的 State of Art
但想想就知道,這個模型不可能被部屬在 Google Translation 上
雖然 Google 大概是世界上擁有最多 CPU, GPU 資源的組織
但在世界上成千上百萬人無聊就打開 Google Translation 玩玩的狀況下
它怎麼可能把這資源怪物拿上去給你玩呢?
像是它的 google visual kit
模型被閹割再閹割,再閹割一次總共三次
參數剩下 1 / 2^3 = 0.125 倍
簡直被閹割到不成人形
但還是能有效的辨識出人貓狗等物體
你說這個放在上面的模型閹割到剩下 0.0125 倍我都相信
中國在人工智慧上的確急起直追
只是你這個「英翻中最強的公司」的結論,下的還是有點急了
※ 引述《derekhsu (華麗的天下無雙)》之銘言:
: 這個翻譯系統目前還在實驗室,所以我們無法測試,不過根據Google以及微軟(Bing)
: 目前在線上的系統來看,我們還是可以看得出目前英文自動翻譯中文的極限。
: 然後,其實這世界上執行英翻中最強的公司,並非Google以及微軟。
: 而是中國公司「有道詞典」。以目前Google跟Bing的翻譯結果來看,他們要達到有道
: 的程度還差很遠,所以我是滿懷疑微軟能達到的成效。有道詞典即使面對GRE等級的
: 閱讀,也可以達到相當令人滿意的翻譯結果。
: 我用這篇CNN今天的新聞為例,分別用Google, Bing以及有道詞典的類神經網路翻譯
: 得到的結果,我附在最後面,我知道大家不太有時間看,所以我挑幾句翻譯的摘要
: 詳情可以看最後的內容。
: http://cnn.it/2FSD3Me
: 原文:
: "This latest action by Russia fits into a pattern of behavior in
: which Russia disregards the international rules-based order,
: undermines the sovereignty and security of countries worldwide,
: and attempts to subvert and discredit Western democratic
: institutions and processes."
: Bing:
: "俄羅斯最近採取的行動符合一種行為模式, 俄羅斯無視國際規則秩序, 破壞
: 世界各國的主權和安全, 企圖顛覆和詆毀西方民主體制。和進程。
: Google:
: “俄羅斯這一最新行動符合俄羅斯無視國際規則秩序,破壞世界各國主權和
: 安全的行為模式,並試圖顛覆和詆毀西方民主機構和進程。”
: 有道詞典:
: “俄羅斯最近采取的行動符合俄羅斯無視國際規則秩序的行為模式,破壞了
: 世界各國的主權和安全,並試圖顛覆和敗壞西方民主體制和進程。”
: 評論-Bing無法正確翻譯which子句,他的中文裡面第一句話跟第二句話兩個俄羅斯
: 都變成了主詞,這破壞了原本英文的詞性。最後一句話的and居然被翻譯成兩句話。
: Google的翻譯基本上大致正確,但是對於子句的認知感到有點奇怪。原文中逗號的
: 三句話的主詞都是This latest action by Russia,應該是 fits..., undermines...,
: 跟and attemps to...這三句詞,用,跟and連接起來。但Google把第一句跟第二句混在
: 一起,變成「符合俄羅斯...秩序,破壞..模式」這也翻譯不正確。
: 而有道詞典厲害的地方在於,他不但正確判斷了三個子句,他也跟Bing一樣補上了
: 「採取」,原主詞原本可以寫成The latest action (taken) by Russia。基本上
: 有道翻譯的結果不用任何修飾,直接可以變成新聞稿。
: 原文:
: The United Kingdom believes Russia was behind the attempted
: murders of Sergei Skripal and his daughter Yulia because the nerve
: agent used, Novichok, was developed in the Soviet Union and could
: not be replicated by non-state actors. London announced Wednesday
: it would expel 23 Russian diplomats after Moscow failed to meet a
: UK deadline to give a "credible response."
: Bing:
: 英國認為, 俄羅斯是在試圖謀殺謝爾蓋 Skripal 和他的女兒的背後, 因為使
: 用的神經代理, 諾維喬克, 是在蘇聯發展, 不能由非國家行動者複製。星期
: 三, 倫敦宣佈將驅逐23俄羅斯外交官, 因為莫斯科未能在英國最後期限前做
: 出 "可信的回應"。
: Google:
: 聯合王國認為,俄羅斯支持對Sergei Skripal和他的女兒尤利婭的企圖謀殺
: 背後,因為使用的神經毒劑Novichok是在蘇聯開發的,無法由非國家行為體
: 複製。倫敦週三宣布,在莫斯科未能在英國的最後期限之前提出“可信的回
: 應”,將驅逐23名俄羅斯外交官。
: 有道詞典:
: 聯合王國認為,俄羅斯是企圖謀殺謝爾蓋·斯克裡帕爾和他的女兒尤利婭的
: 幕後黑手,因為他們使用的神經毒氣,諾維科夫,是在蘇聯發展起來的,不
: 能被非國家行為者復制。倫敦周三宣布,將驅逐23名俄羅斯外交官。此前,
: 莫斯科未能在英國的最後期限前給出“可信的回應”。
: 評論-Bing翻譯姓名只翻譯了一半,無法正確翻譯behind,nerve agent翻成神經代理
: ,數字背後不會接量詞(這是英翻中一項最困難的一點)。不過Bing執得稱讚的一點
: 是他是唯一翻譯出「英國」的翻譯系統。
: Google跟Bing一樣無法應對behind的翻譯,但是正確的把develop翻成了開發,然後
: 「非國家行為體」也是三者當中似乎最靠近原意的,但是他最後卻嚴重了誤判了最後
: 一段,雖然他正確補上了「名」但是,他把順序搞錯了,俄羅斯已經錯過了deadline
: ,而Google卻翻譯成if。
: 有道詞典最棒的地方是它成功的把behind翻譯成幕後黑手,這句話翻譯得很漂亮,可惜
: 聯合王國依然無法翻譯成英國,沒能把develop翻譯成開發。「非國家行為者」有點
: 奇怪,整體來說,依然是三者最優。
: 原文:
: But Haley laid the blame firmly at Russia's door. Highlighting
: Moscow's support of the Assad regime in Syria following that
: government's use of chemical weapons against civilians, Haley told
: fellow diplomats the world had reached "a defining moment."
: Bing:
: 但是海莉把責任牢牢地放在了俄羅斯的門上。在敘利亞政府對平民使用化學
: 武器後, 俄羅斯支援阿薩德政權, 哈利告訴外交官們, 世界已經達到了 "一
: 個決定性的時刻"。
: Google:
: 但是海莉牢牢地將責任歸咎於俄羅斯的大門。海萊在政府對平民使用化學武
: 器之後強調莫斯科支持敘利亞的阿薩德政權,他告訴外交官,世界已經達到
: 了“一個決定性時刻”。
: 有道詞典:
: 但海利卻把責任推到了俄羅斯的家門口。在敘利亞政府使用化學武器對付平
: 民之後,哈雷強調了莫斯科對敘利亞阿薩德政權的支持,他告訴其他外交官
: ,世界已經到了“決定性時刻”。
: 評論-Bing沒有翻譯出Highlighting,「把責任牢牢地放在了俄羅斯的門上」感覺
: 非常奇怪。Haley在前後兩句話姓名可以翻成兩個不一樣的海莉跟哈利?
: 「fellow diplomat」的fellow沒有翻譯出來。
: Google這句「但是海莉牢牢地將責任歸咎於俄羅斯的大門」完全不知所云,甘俄羅斯
: 的大門什麼事?然後一個Haley在前後兩句話姓名可以翻成兩個不一樣的-海莉跟海萊
: 。「fellow diplomat」跟bing一樣沒有翻譯出來
: 有道詞典:「但海利卻把責任推到了俄羅斯的家門口。」是唯一合理把door的意思準
: 確用中文翻譯出來的系統,「Highlighting」正確翻譯出「強調」,不過整句話「
: 強調」應該翻譯成「哈雷強調了莫斯科在敘利亞政府使用化學武器對付平民之後對敘
: 利亞阿薩德政權的支持」比較通順。正確的翻譯出「其他外交官」但是他們還是無法
: 正確應對姓名的翻譯,跟Bing以及Google一樣。Haley變成海利跟哈雷。