[发明专利]一种语音交互方法及设备有效
| 申请号: | 201810301962.9 | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN108509619B | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 李锐;陈志刚;刘权;王智国 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G10L15/22;G10L15/26 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
| 地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 交互 方法 设备 | ||
本申请公开了一种语音交互方法及设备,可以分析待辨别语音与历史交互数据之间的关联关系,其中,历史交互数据包括待辨别语音之前的一条用户语音指令以及对该用户语音指令的响应结果,然后,可以根据二者之间的关联关系判断待辨别语音是否为指令型语音,当判断出待辨别语音为非指令型的干扰语音时,便可以不对其进行指令响应,从而避免了一次错误的人机交互,进而提升了用户体验。
技术领域
本申请涉及语音技术领域,尤其涉及一种语音交互方法及设备。
背景技术
随着计算机和人工智能技术的进步,人机交互技术也在不断发展,尤其是具有人机交互功能的智能家居、机器人等智能设备将具有广阔的发展前景。
以机器人为例,目前的人机交互流程一般可包括以下步骤:
首先,通过固定的命令词唤醒机器人;然后,机器人利用声学上的语音端点检测技术(Voice Activity Detection,简称VAD),从连续的语音流中检测出有效的语音段,即检测出有效语音的起始点以及结束点,当检测到结束点时,将该有效语音的识别结果作为指令送入语义理解引擎;最后,机器人根据语义理解引擎的处理结果,对该指令做出响应。
可见,目前的人机交互指令是通过VAD技术从用户语音中获得的,然而在实际场景下,由于VAD技术只能去除非人声干扰,无法去除用户旁边的非指令的人声干扰,如果将这样的人声干扰作为“指令”送入语义理解引擎,将会导致了一次错误的人机交互,从而影响了用户体验。
发明内容
本申请实施例的主要目的在于提供一种语音交互方法及设备,能够判断出用户语音是否为指令型语音。
本申请实施例提供了一种语音交互方法,包括:
将当前获取的用户语音作为待辨别语音;
根据所述待辨别语音与历史交互数据之间的关联关系,判断所述待辨别语音是否为指令型语音,其中,所述历史交互数据包括第一历史指令以及对所述第一历史指令的响应结果,所述第一历史指令为所述待辨别语音之前的一条用户语音指令;
若所述待辨别语音为指令型语音,则对所述待辨别语音进行响应;
若所述待辨别语音为非指令型语音,则不对所述待辨别语音进行响应。
可选的,所述根据所述待辨别语音与历史交互数据之间的关联关系,判断所述待辨别语音是否为指令型语音,包括:
根据第一关联关系和第二关联关系,判断所述待辨别语音是否为指令型语音,其中,所述第一关联关系为所述待辨别语音与所述响应结果在语义上的关联关系,所述第二关联关系为所述待辨别语音与所述第一历史指令在声纹特征上的关联关系。
可选的,所述方法还包括:
收集属于当前对话领域的各组人机交互数据,其中,部分或全部的人机交互数据中包括指令型的用户样本语音以及非指令型的用户样本语音;
利用所述各组人机交互数据构建语义理解模型语音指令辨别模型;
则,所述根据第一关联关系和第二关联关系,判断所述待辨别语音是否为指令型语音,包括:
利用所述语义理解模型语音指令辨别模型,确定所述第一关联关系和所述第二关联关系,并根据第一关联关系和第二关联关系,判断所述待辨别语音是否为指令型语音。
可选的,所述方法还包括:
将所述用户样本语音的识别文本作为待标注文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810301962.9/2.html,转载请声明来源钻瓜专利网。





