“一段視頻從電視台錄製信號進來之后,機器自動進行片斷分割,以及廣告的自動識別、
自動分段。原來需要編輯輸入標題和介紹,現在百分之八九十以上工作自動完成,字幕、
語音也是自動識別的。”
http://tech.sina.com.cn/d/2015-04-08/doc-iawzuney2757670.shtml
看文章意思是
人工智慧將視頻的語音自動轉成文字(字幕)
現在技術有那麼好嗎?
我覺得光是Google語音對人聲的辨識都還不夠好
影片裡的語音更多更混亂
怎麼做的到堪用的語音辨識?
或者我誤會文章的意思
thank