特定人语音唤醒简介

2021-11-06 04:13:58

1.

什么是特定人语音唤醒

人的语音中含有大量的信息，除了语音内容(说了什么)外，还有语种(中文、英语)、身份(张三、李四)、情绪(平静、开心)等信息。

特定人语音唤醒，就是通过识别语音中所含的内容和人的身份信息，来实现特定人语音唤醒功能。这是一种较为新颖、具有一定安全性、便捷性和趣味性的功能，同时可以增强个性化体验。在yunos语音助手中，就应用了此功能。此时机主可以通过“你好小云”这个语音口令，解锁手机并且唤醒yunos语音助手。

和常见的语音唤醒相比，特定人语音唤醒功能不仅要求说对唤醒口令、还会判断是谁在说出这个口令。一旦口令不对或者身份不对，则会拒绝解锁手机和唤醒yunos语音助手。

2.

特定人语音唤醒的基本框架

特定人语音唤醒方案整体框图如下：

语音唤醒使用之前需要一个初始设置，特定人语音唤醒也一样，这是让智能设备认识用户自己声音的过程，初始设置在这里称之为“注册”，对应于模式识别的训练过程。默认情况下，用户根据页面提示，说出三遍“你好小云”就可以完成初始设置。注册完了之后，用户就可以使用特定人语音唤醒了。使用时，只有预设的语音口令内容、说话人身份都匹配的时候，手机才能解锁或者打开特定程序。

3.

分层次gmm(higmm)模型

除了vad(静音检测)、特征提取、评分等模块之外，模型是是整个方案中的关键。为了实现同时完成语音唤醒和特定人判别，我们设计了一个分层次gmm(higmm)方案。模型训练如下图所示。

其中，需要完成的步骤有：1. 训练一个和说话人无关、内容无关的全局gmm模型；2. 根据注册数据，训练一个特定人、和内容无关的gmm模型；这一步的gmm模型，可以根据最大后验准则，用全局gmm和训练数据获得；3. 根据注册数据，训练一系列的特定人、特定内容的gmms。这个过程中，首先需要把整个句子合理地切分成几个语音段，对于每个语音段，根据2的gmm，训练一个gmm。由于每一个语音段都表示了特定说话内容因此训练得到的gmm，代表了特定人、特定文本内容；gmm序列组合起来，则代表了特定人、特定口令内容。

4.

特定人语音唤醒应用

目前云手机上，yunos语音助手集成了特定人声纹唤醒功能，用户可以通过“你好小云”唤醒yunos语音助手。

yunos语音助手声纹功能还可以“被锻炼”，随着唤醒次数增多，可以使yunos语音助手更熟悉用户的声音，并且减少他人的声音或者噪声带来的误操作。

以后，具有特定人语音唤醒功能的手机，还可以有更多的应用。比如：当你找不到自己手机的时候，你喊出“你好小云”就能将手机唤醒，此时手机可以响铃，做出“我在这里”的回应。另一种用途是当你想听自己喜欢的歌的时候，喊出“hey，

小y，

特定人语音唤醒简介

继续阅读

透过天猫精灵看阿里AI

从领先到引领，浪潮凭借的是技术自信

西工大实验室负责人谢磊教授：智能语音技术新发展与发展趋势

人工智能：智能语音技术应用场景介绍

ChatGPT，科幻逐渐进击现实！新型人工智能聊天机器人模型ChatGPT横空出世，引发轰动，活跃用户数或已达1亿Cha

ChatGPT和其他人工智能技术可能会取代一些简单、重复性高的工作，例如数据录入、信息检索和一些文本生成任务。但是，这并

文字转语音

1.点击发现新世界：GPT模型让AI更懂你2.改变AI体验的GPT模型：让交互更自然3.消弭翻译障碍的GPT模型：让语言

语音增强效果的测试方法

麦克风的指向性

日常生活中录音识别准确率低怎么办？录音转文字的出现，极大地方便了人们的工作和生活，特别是对于需要大量文字处理的人群来说，

因子分析、联合因子分析（JFA）、i-vector

说话人识别中的数据预处理和数据增强

小心！美国AI语音诈骗猖獗七成受访者称没信心分出真假[汗](华盛顿综合电)在美国，不法分子正在越来越多地利用人工智能语音

云通信产品运营带你玩转号码隐私保护

昆仑KNSIPSP-L4-30W工业场所应用型防水防尘扬声器，ABS机身材料，防护等级：IP67。易于安装室外，扬声器内