[发明专利]语音处理方法和装置在审
| 申请号: | 202010365024.2 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111583956A | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 徐培来 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L15/02;G10L15/18;G10L15/22 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 方法 装置 | ||
1.一种语音处理方法,包括:
获取语音流;
对所述语音流进行语音特征识别;
在识别出所述语音流中包含多个用户的语音特征的情况下,基于所述语音流中的不同用户的语音特征,从所述语音流中确定出不同用户对应的语音信息,得到多个语音信息;
确定所述多个语音信息中满足第一条件的语音信息为目标语音信息;
响应所述目标语音信息。
2.根据权利要求1所述的方法,所述确定所述多个语音信息中满足第一条件的语音信息为目标语音信息,包括:
确定所述多个语音信息中包含有可执行的语音指令的语音信息为目标语音信息。
3.根据权利要求1所述的方法,所述确定所述多个语音信息中满足第一条件的语音信息为目标语音信息,包括:
确定所述多个语音信息中用于向语音识别设备输入语音指令的语音信息为目标语音信息。
4.根据权利要求3所述的方法,所述确定所述多个语音信息中用于向语音识别设备输入语音指令的语音信息为目标语音信息,包括:
对所述多个语音信息中每个语音信息进行语义识别;根据所述语音信息的语义识别结果,确定所述语音信息是否为用于向语音识别设备输入的语音指令;确定所述多个语音信息中用于向语音识别设备输入语音指令的语音信息为目标语音信息;
和/或,确定所述多个语音信息中包含有唤醒词的语音信息为目标语音信息;
和/或,基于对所述多个语音信息的语义识别,确定所述多个语音信息之间的语义关联关系;基于所述多个语音信息之间的语义关联关系,确定所述语音信息与所述多个语音信息中的其他语音信息之间是否存在语句问答关系,并将与其他语音信息之间不存在语句问答关系的语音信息确定为目标语音信息;
和/或,确定所述语音信息所归属的用户是否关联有用户信息库;如所述语音信息所归属的用户关联有用户信息库,结合所述语音信息的语义识别结果和所述用户信息库,从所述多个语音信息中确定用于向语音识别设备输入语音指令的目标语音信息。
5.根据权利要求1、3或者4所述的方法,所述响应所述目标语音信息,包括:
在确定出所述目标语音信息包含有可执行的语音指令的情况下,响应所述目标语音信息对应的语音指令。
6.根据权利要求2所述的方法,所述确定所述多个语音信息中包含有可执行的语音指令的语音信息为目标语音信息,包括:
识别所述多个语音信息中每个语音信息的语义;
根据所述语音信息的语义,确定语音指令库中与所述语音信息存在相关性的至少一个语音指令以及所述语音信息与每个所述语音指令的相关程度;
在所述语音指令库中存在与所述语音信息的相关程度超过设定阈值的至少一个语音指令的情况下,将所述超过设定阈值的至少一个语音指令确定为所述语音信息关联的目标语音指令;
确定所述多个语音信息中关联有目标语音指令的语音信息为目标语音信息。
7.根据权利要求1所述的方法,所述对所述语音流进行语音特征识别,包括:
对所述语音流进行声纹识别;
所述在识别出所述语音流中包含多个用户的语音特征的情况下,基于所述语音流中的不同用户的语音特征,从所述语音流中确定出不同用户对应的语音信息,包括:
在识别出所述语音流中包含多个用户的声纹特征的情况下,基于所述语音流中的不同用户的声纹特征,从所述语音流中确定出不同用户对应的语音信息。
8.根据权利要求1所述的方法,所述获取语音流,包括:
响应于接收到的包含唤醒词的语音信号,获取语音流;
所述确定所述多个语音信息中满足第一条件的语音信息为目标语音信息,包括:
将所述多个语音信息中,语音特征与所述语音信号的语音特征相同的语音信息确定为目标语音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010365024.2/1.html,转载请声明来源钻瓜专利网。





