[发明专利]一种基于语音属性分类的交互系统及其方法有效

申请号：	201610244968.8	申请日：	2016-04-19
公开（公告）号：	CN105761720B	公开（公告）日：	2020-01-07
发明（设计）人：	潘复平	申请（专利权）人：	北京地平线机器人技术研发有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/02;G10L15/06;G10L15/08;G10L25/30;G10L25/63;G10L25/66
代理公司：	11497 北京市正见永申律师事务所	代理人：	黄小临;王怀章
地址：	100085 北京市海淀区上地信息路1号(北京实创高***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音属性分类交互系统及其方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种基于语音属性分类的交互系统及其方法。所述系统包括：声学特征提取单元，配置用于提取输入的语音信号的声学特征，生成第一信号；语音属性分类单元，配置用于第一信号经属性识别分类器确定其语音属性值，输出语音属性结果，生成第二信号；交互决策单元，配置用于基于第二信号输出反馈信息。语音属性分类单元同时检测多种语音属性，根据各语音属性值输出相应的反馈信息，使交互流程丰富多彩。

技术领域

本公开一般涉及交互领域，具体涉及人机交互技术，尤其涉及基于语音属性的交互系统。

背景技术

常规的人机语音交互过程表现为机器识别人发出的语音指令，然后根据识别结果，做出相应的反应。这种交互包含的内容仅限于语音指令的字面含义，形式单一，用户体验枯燥，不适用于玩具、家居等需要形式活泼多样的交互场景。

目前，在人机交互中，常采用声纹注册技术判断用户身份，实现人性化的交互。声纹注册过程中，先用声纹识别技术把用户的语音进行注册，把用户身份与声纹相关联，然后在使用过程中，先识别说话人的声纹，然后根据声纹判断说话人的身份，再根据用户身份进行一些有限的交互变化。比如一些智能玩具可以根据声音判断当前说话人是爸爸、妈妈还是宝宝，根据身份的不同，可以改变对说话人的称谓。

现有技术的缺点在于，一方面，传统技术往往只能检测一种语音属性，根据语音属性的不同，交互内容发生的变化也十分有限；另一方面，声纹注册技术使用起来十分繁琐且不灵活。

发明内容

鉴于现有技术中的上述缺陷或不足，期望提供一种基于语音属性分类的交互系统及其方法。

第一方面，提出一种基于语音属性分类的交互系统，该系统包括：

声学特征提取单元，配置用于提取输入的语音信号的声学特征，生成第一信号；

语音属性分类单元，配置用于第一信号经属性识别分类器确定其语音属性值，输出语音属性结果，生成第二信号；

交互决策单元，配置用于基于第二信号输出反馈信息。

第二方面提供一种基于语音属性分类的交互方法，该方法包括：

提取输入的语音信号的声学特征，生成第一信号；

第一信号经属性识别分类确定其语音属性值，输出语音属性结果，生成第二信号；

基于第二信号输出反馈信息。

根据本申请实施例提供的技术方案，语音属性分类单元可以同时检测语音的多种语音属性，并根据各语音属性值输出相应的反馈信息，使交互流程丰富多彩；另外，本发明通过语音属性分类，能够自动判断说话人的身份，所以不需要注册过程，使用简单方便，自由灵活。