[发明专利]语音处理方法和装置在审
| 申请号: | 202010365024.2 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111583956A | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 徐培来 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L15/02;G10L15/18;G10L15/22 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 方法 装置 | ||
本申请公开了一种语音处理方法和装置,该方法包括:获取语音流;对语音流进行语音特征识别;在识别出语音流中包含多个用户的语音特征的情况下,基于语音流中的不同用户的语音特征,从语音流中确定出不同用户对应的语音信息,得到多个语音信息;确定多个语音信息中满足第一条件的语音信息为目标语音信息;响应目标语音信息。本申请的方案减少了由于语音流中语音信息复杂而导致无法准确响应语音指令的情况。
技术领域
本申请涉及自然语言处理技术领域,更具体地说,涉及一种语音处理方法和装置。
背景技术
随着技术的不断发展,用户通过语音控制电子设备已经十分普遍。如,安装有语音助手等语音处理软件的智能音箱,可以检测用户输入的语音,并确定该语音所指示的指令并执行。
但是现有的语音助手在环境音复杂的场景下(如接收用户指令的同时还有其他人在说话),很容易发生响应失败的问题。
发明内容
为实现上述目的,本申请提供了一种语音处理方法和装置。
其中,一种语音处理方法,包括:
获取语音流;
对所述语音流进行语音特征识别;
在识别出所述语音流中包含多个用户的语音特征的情况下,基于所述语音流中的不同用户的语音特征,从所述语音流中确定出不同用户对应的语音信息,得到多个语音信息;
确定所述多个语音信息中满足第一条件的语音信息为目标语音信息;
响应所述目标语音信息。
优选的,所述确定所述多个语音信息中满足第一条件的语音信息为目标语音信息,包括:
确定所述多个语音信息中包含有可执行的语音指令的语音信息为目标语音信息。
优选的,所述确定所述多个语音信息中满足第一条件的语音信息为目标语音信息,包括:
确定所述多个语音信息中用于向语音识别设备输入语音指令的语音信息为目标语音信息。
优选的,所述确定所述多个语音信息中用于向语音识别设备输入语音指令的语音信息为目标语音信息,包括:
对所述多个语音信息中每个语音信息进行语义识别;根据所述语音信息的语义识别结果,确定所述语音信息是否为用于向语音识别设备输入的语音指令;确定所述多个语音信息中用于向语音识别设备输入语音指令的语音信息为目标语音信息;
和/或,确定所述多个语音信息中包含有唤醒词的语音信息为目标语音信息;
和/或,基于对所述多个语音信息的语义识别,确定所述多个语音信息之间的语义关联关系;基于所述多个语音信息之间的语义关联关系,确定所述语音信息与所述多个语音信息中的其他语音信息之间是否存在语句问答关系,并将与其他语音信息之间不存在语句问答关系的语音信息确定为目标语音信息;
和/或,确定所述语音信息所归属的用户是否关联有用户信息库;如所述语音信息所归属的用户关联有用户信息库,结合所述语音信息的语义识别结果和所述用户信息库,从所述多个语音信息中确定用于向语音识别设备输入语音指令的目标语音信息。
优选的,所述响应所述目标语音信息,包括:
在确定出所述目标语音信息包含有可执行的语音指令的情况下,响应所述目标语音信息对应的语音指令。
优选的,所述确定所述多个语音信息中包含有可执行的语音指令的语音信息为目标语音信息,包括:
识别所述多个语音信息中每个语音信息的语义;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010365024.2/2.html,转载请声明来源钻瓜专利网。





