https://www.chinatimes.com/newspapers/20221028000240-260204?chdtv
Meta英翻台 全靠閩南語劇
04:10 2022/10/28 工商時報 何英煒
https://images.chinatimes.com/newsphoto/2022-10-28/1024/A13A00_P_02_01.jpg
Meta AI軟體工程師陳鵬仁,是該公司UST部門的主要研發人員,負責語音對語音即時翻譯
,第一個成功做出來的語系為閩南語。來自台灣的他,也透過閩南語的繪本,教小孩熟悉
閩南語。圖/業者提供
Meta上周發表AI技術支援非書寫語音翻譯系統,首先推出的是閩南語系。負責這項開發專
案的AI軟體工程師陳鵬仁來自台灣。26日晚間陳鵬仁接受越洋訪問時表示,此次語言資料
庫來源靠的是台灣閩南語連續劇,這研發過程中,也獲得台大教授李弘毅及陽明交通大學
廖元甫教授實驗室的鼎力相助。
陳鵬仁表示,現在所有的語言翻譯都是以文字為基礎,Meta是第一個實踐語音直接翻譯成
語言的公司。而這也與Meta的目標一致,希望未來在元宇宙時代,大家即時互動時,可以
直接用語言交談,即使是不同語言及語系,可以直接翻譯,不需要透過文字。
Meta負責語音對語音即時翻譯的團隊為Universal Speech Translator(UST,通用語音翻
譯工具),在做出閩南語系的語音翻譯後,陳鵬仁表示,未來的目標將希望語音翻譯更精
準、更順暢、更即時,延遲時間更縮短。
談到研發的困難,他表示「最困難的是資料的蒐集」,沒有文字書寫的語言,通常是資源
匱乏的語言,也沒有足夠的資料以供機器訓練和學習。尤其是閩南語的七聲八調,特定語
氣代表不同意義,是非常不容易的事情。
陳鵬仁表示,研發過程中,獲得許多人的幫助,例如台大的李宏毅教授及陽明交通大學的
廖元甫教授,均將研究室語音資料庫提供給Meta,而來自台灣的閩南語連續劇,也成為資
料庫重要的來源。
至於接下來還會考慮什麼樣的語系,陳鵬仁說,目前尚未定案,但是客語及原住民語言都
是考慮範圍內。目前Meta的語音對語音翻譯還屬於研發及實驗階段,商業化時間點預計在
2~5年後。
Meta創辦人兼執行長祖克柏(Mark Zuckerberg)上周與陳鵬仁在臉書上秀出一段英語與
閩南語對談的即時翻譯影片,該影片獲19萬人按讚,並有184萬人看過。
陳鵬仁表示,該影片上線後,的確收到很多詢問,像是他開民宿的伯父就問他那裡可以買
得到嗎?因為當有外國客人投宿時,此系統將可幫助彼此溝通順暢。
#語系 #語言 #研發 #教授 #資料