基于深度學習的系統可以提供更高的準确性以及細節度。
最近,迪士尼研究院聯合東安格利亞大學、加利福尼亞理工大學和卡内基梅隆大學的研究人員,釋出了一篇題為“A Deep Learning Approach for Generalized Speech Animation”的論文,闡述了通過深度學習來實作程式語音動畫的方法。該方法采樣完人們的錄音後,即可自動生成與語音相比對的口型動畫。
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiIwAjMx81dswGbpZ2XtxSZ6l2clJ3LcV2Zh1Wa9M3clN2byBXLzN3btg3PnBnauczMxYDM4ETMxcTM4AzNxAjMvw1NxgDMvw1NxAjMvwVZslmZkF2bsBXdvwVbvNmLyV2ah1mMtlmLzN3bvw1LcpDc0RHaiojIsJye.jpg)
據了解,這是一個借助深度學習方法進行訓練的系統,它能夠分析來自任何揚聲器的音頻,學習從語音标簽輸入序列到口部運動的任意非線性映射,然後系統會自動生成相應的口形以及符合語音的面部模型。
另外,在一些VR社交應用中也有通過系統實作語音動畫的方式,主要也是基于音頻來制作虛拟形象的口型動畫,而基于深度學習的系統可以提供更高的準确性以及細節度。
原文釋出時間:2017-08-17 11:17
本文作者:巫盼
本文來自雲栖社群合作夥伴鎂客網,了解相關資訊可以關注鎂客網。