[发明专利]一种语音交互方法、装置、设备及存储介质在审
申请号: | 201910343729.1 | 申请日: | 2019-04-26 |
公开(公告)号: | CN109949812A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 戚耀文 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户图像 用户动作 存储介质 语音交互 语音信息 预设动作 匹配 采集 停止接收 用户体验 语音识别 响应 音信息 唤醒 | ||
本发明实施例提出一种语音交互方法、装置、设备及存储介质,其中方法包括:采集第一用户图像,识别所述第一用户图像中的用户动作;响应于所述第一用户图像中的用户动作与第一预设动作相匹配,接收语音信息并对所述语音信息进行语音识别;采集第二用户图像,识别所述第二用户图像中的用户动作;响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配,停止接收语音信息。本发明实施例能够简化唤醒流程,改善用户体验。
技术领域
本发明涉及语音交互技术领域,尤其涉及一种语音交互方法、装置、设备及存储介质。
背景技术
语音交互设备在接收用户发出的语音指令之前,需要首先被唤醒。目前一般采用语音唤醒的方式,例如用户发出包含唤醒词的语音信息,当语音交互设备识别出该唤醒词时,语音交互设备被唤醒。现有的语音交互方法中,每次在进行语音交互前用户都需要说一次唤醒词,这种方式的用户体验较差。
发明内容
本发明实施例提供一种语音交互方法及装置,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种语音交互方法,包括:
采集第一用户图像,识别所述第一用户图像中的用户动作;
响应于所述第一用户图像中的用户动作与第一预设动作相匹配,接收语音信息并对所述语音信息进行语音识别;
采集第二用户图像,识别所述第二用户图像中的用户动作;
响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配,停止接收语音信息。
在一种实施方式中,所述识别所述第二用户图像中的用户动作之后,还包括:
响应于所述第二用户图像中的用户动作与第二预设动作相匹配,停止接收语音信息,并删除所述语音识别的结果。
在一种实施方式中,还包括:响应于所述第一用户图像中的用户动作与第一预设动作相匹配,提示所述匹配的信息,并提示语音交互过程已开启;
所述接收语音信息并对所述语音信息进行语音识别时,进一步提示正在接收语音信息,并显示所述语音识别的结果。
在一种实施方式中,所述采集第二用户图像,识别所述第二用户图像中的用户动作,包括:
采集多帧第二用户图像;
根据各帧所述第二用户图像中的用户状态,识别所述多帧第二用户图像中的用户动作。
第二方面,本发明实施例还提出一种语音交互装置,包括:
第一采集识别模块,用于采集第一用户图像,识别所述第一用户图像中的用户动作;
第一处理模块,用于响应于所述第一用户图像中的用户动作与第一预设动作相匹配,接收语音信息并对所述语音信息进行语音识别;
第二采集识别模块,用于采集第二用户图像,识别所述第二用户图像中的用户动作;
第二处理模块,用于响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配,停止接收语音信息。
在一种实施方式中,所述装置还包括:
第三处理模块,用于响应于所述第二用户图像中的用户动作与第二预设动作相匹配,停止接收语音信息,并删除所述语音识别的结果。
在一种实施方式中,所述装置还包括:
第一提示模块,用于响应于所述第一用户图像中的用户动作与第一预设动作相匹配,提示所述匹配的信息,并提示语音交互过程已开启;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910343729.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能语音门锁的控制系统
- 下一篇:一种将语音转换为文字的方法、装置及系统