天天看點

用科技賦能文化 喜馬拉雅ASR技術榮獲業界評測第一名

作者:上觀新聞
用科技賦能文化 喜馬拉雅ASR技術榮獲業界評測第一名

近日,SpeechIO TIOBE評測(簡稱“評測”)第三季度結果公布,喜馬拉雅自動語音識别技術(簡稱“ASR”)在本次評測中榮獲第一名。目前,喜馬拉雅這一技術已在喜馬拉雅App的“AI文稿功能”中廣泛應用,為讀者帶來邊聽邊看、聽看一體的内容消費體驗。

SpeechIO TIOBE評測是國内較為權威的行業公開評測項目,旨在客觀評估并記錄各個公共語音識别服務在不同領域的識别準确率,以字準确率為測試名額。該評測每個季度進行一次,喜馬拉雅ASR技術在今年第三季度的評測中脫穎而出,以2.16%的超低錯誤率榮獲冠軍。參與此次評測的其他公司還包括依圖、騰訊、Bilibili、阿裡、微軟、訊飛、百度等。

用科技賦能文化 喜馬拉雅ASR技術榮獲業界評測第一名

喜馬拉雅ASR技術是喜馬拉雅智能語音實驗室所研發的一項重要語音技術,該技術可以對喜馬拉雅平台中無文稿的聲音内容進行語音轉寫,并輸出相應的文字,進而便于聽衆更好地了解聲音内容。随着語音識别功能使用率的提高,細節上的極緻優化成為技術産品制勝的關鍵。喜馬拉雅在研發時,基于WeNet開發了自研的“端到端”語音識别架構,并在資料讀取、模型結構、訓練方式、熱詞增強、部署流程等全鍊路進行了深度優化,不斷嘗試新的論文方案,融合吸收到自研架構當中,進而有效降低了錯誤率,達到行業領先水準。

目前,喜馬拉雅ASR技術現在已經廣泛應用到了喜馬拉雅App的AI文稿功能上,能有效識别無文稿聲音内容,為無文稿聲音内容生成文稿。同時,對于已經有原始文稿的聲音内容,喜馬拉雅AI文稿功能則應用超長音頻與文本的對齊技術,将聲音與文稿進行時間戳對軌,在聲音播放的同時,對相應文字進行同步高亮,讓使用者能有更好的收聽體驗。

用科技賦能文化 喜馬拉雅ASR技術榮獲業界評測第一名

近年來,喜馬拉雅在AI語音技術領域潛心鑽研,并在内部專門成立了喜馬拉雅智能語音實驗室這一核心部門,長期專注于語音合成、語音識别、語音信号處理、編解碼以及智能音效的研究和開發。除了ASR技術,喜馬拉雅的TTS(語音合成)技術也處于行業前列,并已經廣泛被運用于評書、新聞、小說等多種内容的制作中,正助力喜馬拉雅在現有的“UGC + PGC + PUGC”内容生态之外,進一步拓展AIGC的可能性。同時,今年喜馬拉雅自研的跨語言語音合成創新技術論文,以及和中國科學技術大學合作的說話人日志技術相關論文,先後兩次被國際音頻頂級會議ICASSP(International Conference on Acoustics, Speech, and Signal Processing,國際音頻、語音與信号處理會議)錄用,展現了喜馬拉雅在語音技術領域強大的實力。

用科技賦能文化 喜馬拉雅ASR技術榮獲業界評測第一名

未來,喜馬拉雅将繼續用科技賦能文化,提升内容消費體驗,豐富内容生态,用技術加持聲音、用聲音服務生活。

責任編輯 劉婉鑫

圖檔來源 企業供圖

繼續閱讀