Re: [新聞] Skype中文即時口譯功能12月上市,10種語

作者: farmerlu (君子風)   2014-11-23 01:51:21
※ 引述《defeatshame ((\アッカリ~ン/(阿卡林))》之銘言:
: Skype中文即時口譯功能12月上市,10種語言會話用中文說給你聽
: 準備好迎接語言交流無障礙的世界了嗎?由微軟營運暨行銷事業群副總經理周旺暾
: 證實,Skype Translator將在2014年12月正式上市,且屆時將支援正體中文。
這進度和馬副院長周五的演講不太一樣啊.
但因周五那場不是公開演講, 筆者不方便 "爆卦".
另, 筆者懷疑中文版是否已經成熟了.
因為微軟 (MSDN) 官網上有許多中文文件, 是用微軟自己的系統譯出來的,
而其中仍有不少明顯的錯誤. 不對照英文的話, 是看不懂意思的.
(例如有一篇類神經網路的文件, 出現類似 "作者進入新的領域" 字樣, 令人完全看不懂.
去找出英文原版, 才知道 "領域" 的原文是 "column", 當下應翻成 "欄位".)
: 另外,其中還有一項人性化的設計,Skype Translator會根據每個人的聲音,
: 模擬合成出翻譯語音的聲音,目標期望做到就像是本人使用不同語言在說話。
口音模擬倒不是頂難的技術.
整個系統的難處在於翻譯引擎核心.
: Skype Translator此時能夠做到即時翻譯各國語言,有2項關鍵要素齊全,
: 第一、大資料時代能分析的資料比過去更多,
: 第二、微軟亞洲研究院常務副院長馬維英認為,雲端架構提供理論上無限的
: 運算資源,讓機器學習(Machine Learning)的數學模型能夠有足夠的
: 訓練(Training),能使結果更接近理想的答案。
筆者的看法不同.
筆者認為要改良演算法才是關鍵, 大數據不是關鍵.
微軟第一版的翻譯引擎花了六個月完成, 是統計式的.(主持人是台灣人)
如果沒有把統計引擎改良, 例如加入類神經演算法, 那麼更多的數據並沒有用.
統計式的引擎, 大約只需要 150 萬 ~ 300 萬個例句給系統學習, 其表現就到頂峰了.
更多的例句只會造成干擾 (稱為雜訊).
註:
翻譯引擎主要分為四類,
1.規則式 (最早問世)
2.統計式 (打敗了規則式)
3.類神經式
4.混合式
作者: Paclitaxel (紫杉醇)   2014-11-23 01:56:00
還在加班中啦
作者: ETTom (喵)   2014-11-23 02:00:00
專業幫推 可惜推的人不多~
作者: Jerrynet (我愛Hot_game板)   2014-11-23 02:01:00
專業推,model和feature也是很重要der~
作者: richjf (jeff)   2014-11-23 02:07:00
專業文
作者: Ricrollp (J.M.M.)   2014-11-23 02:21:00
看不懂推一個
作者: YahooTaiwan (超可愛南西我老婆)   2014-11-23 02:35:00
你都知道了,微軟工程師會不知道?
作者: DarkerDuck (達克鴨)   2014-11-23 07:07:00
專業推一個
作者: iorittn (IORITTN)   2014-11-23 07:15:00
專業推
作者: spfy (spfy)   2014-11-23 07:20:00
嗚嗚嗚 N粉跪求原PO澄清NOKIA沒有倒閉...

Links booklink

Contact Us: admin [ a t ] ucptt.com