迪士尼研究院用深度學習打造語音動畫，讓VR社交更真實

2018-02-28 23:50:00

基于深度學習的系統可以提供更高的準确性以及細節度。

最近，迪士尼研究院聯合東安格利亞大學、加利福尼亞理工大學和卡内基梅隆大學的研究人員，釋出了一篇題為“A Deep Learning Approach for Generalized Speech Animation”的論文，闡述了通過深度學習來實作程式語音動畫的方法。該方法采樣完人們的錄音後，即可自動生成與語音相比對的口型動畫。

據了解，這是一個借助深度學習方法進行訓練的系統，它能夠分析來自任何揚聲器的音頻，學習從語音标簽輸入序列到口部運動的任意非線性映射，然後系統會自動生成相應的口形以及符合語音的面部模型。

另外，在一些VR社交應用中也有通過系統實作語音動畫的方式，主要也是基于音頻來制作虛拟形象的口型動畫，而基于深度學習的系統可以提供更高的準确性以及細節度。

原文釋出時間：2017-08-17 11:17

本文作者：巫盼

本文來自雲栖社群合作夥伴鎂客網，了解相關資訊可以關注鎂客網。

迪士尼研究院用深度學習打造語音動畫，讓VR社交更真實

繼續閱讀

Surprise：一個Python推薦系統算法庫一、基本子產品二、實作推薦算法

pytorch動态調整學習率之Multistep政策

tensorflow學習——keras進階API——序列模型Sequential

SVD原理和案例(奇異值分解)

連續兩年入圍全球Gartner ABI魔力象限，Quick BI在商業智能領域究竟有何魔力？1、互動式的分析和可視化2、建構資料故事3、釘釘內建4、增強分析Quick BI

技術解密｜阿裡雲多媒體 AI 團隊是憑借什麼拿下 CVPR2021 5冠1亞的？頂級挑戰賽戰績顯赫四大挑戰的關鍵技術探索基于視訊了解技術打造多媒體 AI 雲産品

算法專家解讀 | 開放搜尋教育搜題能力和實踐

Keras使用分批疊代（fit_generate）的方式訓練資料

圖像分割UNet系列------UNet3+（UNet3plus）詳解

圖像分割UNet系列------UNet詳解

特征：什麼是特征和特征選擇？

Pytorch(二) Tensor Tensor的建立Tensor是什麼Tensor的建立

VGGNet------超經典神經網絡結構與PyTorch實作

tensorflow學習——（imdb資料集）文本分類first_2.py

Matlab深度學習-手寫體數字識别Matlab深度學習前言一、MNIST手寫體數字資料二、用到的深度學習架構-LeNet5三、代碼最後

K-近鄰算法以及圖像分類應用