[发明专利]一种语音交互方法、装置、设备及存储介质在审
申请号: | 201910343729.1 | 申请日: | 2019-04-26 |
公开(公告)号: | CN109949812A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 戚耀文 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户图像 用户动作 存储介质 语音交互 语音信息 预设动作 匹配 采集 停止接收 用户体验 语音识别 响应 音信息 唤醒 | ||
1.一种语音交互方法,其特征在于,包括:
采集第一用户图像,识别所述第一用户图像中的用户动作;
响应于所述第一用户图像中的用户动作与第一预设动作相匹配,接收语音信息并对所述语音信息进行语音识别;
采集第二用户图像,识别所述第二用户图像中的用户动作;
响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配,停止接收语音信息。
2.根据权利要求1所述的方法,其特征在于,所述识别所述第二用户图像中的用户动作之后,还包括:
响应于所述第二用户图像中的用户动作与第二预设动作相匹配,停止接收语音信息,并删除所述语音识别的结果。
3.根据权利要求1或2所述的方法,其特征在于,还包括:响应于所述第一用户图像中的用户动作与第一预设动作相匹配,提示所述匹配的信息,并提示语音交互过程已开启;
所述接收语音信息并对所述语音信息进行语音识别时,进一步提示正在接收语音信息,并显示所述语音识别的结果。
4.根据权利要求1或2所述的方法,其特征在于,所述采集第二用户图像,识别所述第二用户图像中的用户动作,包括:
采集多帧第二用户图像;
根据各帧所述第二用户图像中的用户状态,识别所述多帧第二用户图像中的用户动作。
5.一种语音交互装置,其特征在于,包括:
第一采集识别模块,用于采集第一用户图像,识别所述第一用户图像中的用户动作;
第一处理模块,用于响应于所述第一用户图像中的用户动作与第一预设动作相匹配,接收语音信息并对所述语音信息进行语音识别;
第二采集识别模块,用于采集第二用户图像,识别所述第二用户图像中的用户动作;
第二处理模块,用于响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配,停止接收语音信息。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第三处理模块,用于响应于所述第二用户图像中的用户动作与第二预设动作相匹配,停止接收语音信息,并删除所述语音识别的结果。
7.根据权利要求5或6所述的装置,其特征在于,所述装置还包括:
第一提示模块,用于响应于所述第一用户图像中的用户动作与第一预设动作相匹配,提示所述匹配的信息,并提示语音交互过程已开启;
第二提示模块,用于在所述第一处理模块接收语音信息并对所述语音信息进行语音识别时,提示正在接收语音信息,并显示所述语音识别的结果。
8.根据权利要求5或6所述的装置,其特征在于,所述第二采集识别模块用于:采集多帧第二用户图像;根据各帧所述第二用户图像中的用户状态,识别所述多帧第二用户图像中的用户动作。
9.一种语音交互设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
10.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910343729.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能语音门锁的控制系统
- 下一篇:一种将语音转换为文字的方法、装置及系统