天天看點

使用Mises-Fisher混合器實作自然音頻流的魯棒說話人聚類

Robust Speaker Clustering using Mixtures of von Mises-Fisher Distributions for Naturalistic Audio Streams

使用Mises-Fisher混合器實作自然音頻流的魯棒說話人聚類

使用Mises-Fisher混合器實作自然音頻流的魯棒說話人聚類

摘要

演講者Diarization(也被稱為“誰是誰以及何時?”)對于多演講者,自然主義者,如Peer-Led團隊學習(PLTL)課程來說,這是一項具有挑戰性的任務。在這項研究中,Mises-Fisher分布基于多變量混合的穩健支援者聚類。我們的diarization管道有兩個階段:(i)地面真相分割; (ii)發音說話人聚類。地面實況語音活動資訊用于從每個語音段提取i-vector。我們使用主成分分析對

繼續閱讀