繼林志玲、郭德綱之后,羅永浩語音包也于近日上線高德導航,以后飆車的時候可以聽到:“我不是為了輸贏,我就是認真”簡直激動得不能自已!
那么問題來了,高德是如何把羅永浩、林志玲、郭德綱的聲音裝進導航里的呢?難不成真是一句一句錄下來的?
ZEALER向我們進行了揭秘,原來,語音導航內容可以分為兩部分:簡單的和復雜的。
簡單的,比如直行、左轉、掉頭……真的就是羅永浩、林志玲親自錄下來的。
而比較長的句子則要用到TTS(Text To Speech)技術了,也就是文本轉語音技術,包括Siri、谷歌翻譯用的就是這一技術。通過計算機語音合成,可以將任意文本轉換成具有高自然度的語音。
原理上,只要讓林志玲姐姐把漢語中的21個聲母、37個韻母、5個聲調組合的不超過3000個語音全部錄一次,播放時,再把每個字的語音串起來就可以了。
這就好比活字印刷術,志玲姐姐每個字的發音都是一個單字,TTS會把這些單字重新排列組合成導航里的長句子。
雖然組字成句聽起來略顯生硬,但隨著TTS語音技術的發展,自然度已經越來越高了。
視頻地址:點此。