天天看点

离线的特定领域语音主力 - 提升语音控制的准确性

以下内容来自Vocalize.ai在Voicebot.ai的文章。

https://voicebot.ai/2020/07/11/improved-voice-control-accuracy-with-domain-specific-assistants/

云端可以为语音识别提供近乎无线的资源,这也是包括Alexa, Siri, Google等语音主力服务平台在理解人类语言表现如此优异的原因。

但问题是,这些基于云端的语音主力服务是为了满足用户的庞杂而广泛的通用需求而服务的,如查询天气,播放音乐,查询新闻和资讯,查询个人日程,控制智能家居设备等等。

正因如此,云端语音主力看起来非常强大是一个通才(generaist),而不是某一个特定领域的专才(specialists)。

由Vocalize.ai近日完成的评测显示,嵌入式的为特定领域打造的语音助理,可以提供比云端通用语音助理更准确的语音识别和自然语言理解能力。

AI通才和AI专家

报告对比了两款语音控制的微波炉,一款是云端AVS语音控制AmazonBasics微波炉,另一款是Sensory嵌入式微波炉专用自然语言交互技术加持的美的微波炉。两款设备均通过40条与微波炉功能相关的语音命令(speech utterances),测试其是否可以正确完成指令任务(complete the requested tasks)。

以下为支持Sensory嵌入式语音助理的美的微波炉产品视频 -

结果显示,采用Sensory技术方案的美的微波炉可以完成93%的语音指令任务,而采用Amazon云端AVS通用语音助理方案的微波炉则仅仅完成了55%。

离线的特定领域语音主力 - 提升语音控制的准确性

比如语音指令-融化巧克力(melt chocolate),Sensory嵌入式语音助理可以正确识别用户意图,而Amazon通用语音主力却将其识别为牛奶巧克力(milk chocolate)。

Test Utterance: Melt chocolate, 8 ounces please.

Sensory Result: Melt chocolate, 8 ounces please.

Amazon Result: Milk chocolate, 8 ounces please.

又比如"thaw"也是融化的意思,Sensory可以正确识别为"defrost",而Amazon却错误的识别为“pause"。

Test Utterance: Thaw salmon for 5 minutes.

Sensory Result: Thaw salmon for 5 minutes.

Amazon Result: Pause salmon for 5 minutes.

训练,调整和加权(Trained, Tuned and Weighted)

从以上对比可以看到,Sensory嵌入式为特定产品优化打造的语音助理服务,可以更好的理解和执行与微波炉相关的功能指令。不仅如此,Sensory也为其他特定领域产品,如流媒体控制,连锁快餐如麦当劳自助语音点餐终端,甚至连锁咖啡店打造了其专用的语音主力服务,如虚拟的咖啡师(barista) -