作者:
fffffff4 (使用者在線上)
2019-01-10 21:21:01※ 引述《gj942l41l4 (米食主義者)》之銘言:
: As title
: 原本以為google小姐只能念單字
: 這樣很簡單
: 就把每個字錄起來就好
: 二十年前電子辭典就做到了
: 另人吃驚的是google小姐可以念句子
: 但是她怎麼知道我要她念什麼句子?
: 人類造句無窮多 uncountable
: 不像單字一樣有窮有盡
: google小姐到底是怎麼辦到的
: google小姐總不可能把人類所有用句都錄起來吧!
: Why???
: 難道google聘了一個人坐在網路另一端
: 看著我輸入的句子然後念出來嗎!
: 那google有缺google先生嗎
: 我也想當google員工求內推~~
: 有沒有八卦啊?
語音合成主要有兩種方法
第一種是unit selection synthesis
請人類配音員錄下上百上千上萬種音
每個樣本都切割成短音,可能只有幾十毫秒、半個phoneme那麼長。
全部存在資料庫,電腦要就拿來合成。
siri就是這種
第二種是parameter synthesis
每個音都有獨特的聲紋,每種聲紋都有自己的參數,電腦用參數就可以合成了。但當然就
不如第一種那麼逼真。
大概是這樣。