[发明专利]一种语音交互方法、装置、设备及存储介质在审

申请号：	201910343729.1	申请日：	2019-04-26
公开（公告）号：	CN109949812A	公开（公告）日：	2019-06-28
发明（设计）人：	戚耀文	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26
代理公司：	北京市铸成律师事务所 11313	代理人：	杨瑾瑾;陈建民
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用户图像用户动作存储介质语音交互语音信息预设动作匹配采集停止接收用户体验语音识别响应音信息唤醒
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提出一种语音交互方法、装置、设备及存储介质，其中方法包括：采集第一用户图像，识别所述第一用户图像中的用户动作；响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所述语音信息进行语音识别；采集第二用户图像，识别所述第二用户图像中的用户动作；响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配，停止接收语音信息。本发明实施例能够简化唤醒流程，改善用户体验。

技术领域

本发明涉及语音交互技术领域，尤其涉及一种语音交互方法、装置、设备及存储介质。

背景技术

语音交互设备在接收用户发出的语音指令之前，需要首先被唤醒。目前一般采用语音唤醒的方式，例如用户发出包含唤醒词的语音信息，当语音交互设备识别出该唤醒词时，语音交互设备被唤醒。现有的语音交互方法中，每次在进行语音交互前用户都需要说一次唤醒词，这种方式的用户体验较差。

发明内容

本发明实施例提供一种语音交互方法及装置，以至少解决现有技术中的以上技术问题。

第一方面，本发明实施例提供了一种语音交互方法，包括：

采集第一用户图像，识别所述第一用户图像中的用户动作；

响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所述语音信息进行语音识别；

采集第二用户图像，识别所述第二用户图像中的用户动作；

响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配，停止接收语音信息。

在一种实施方式中，所述识别所述第二用户图像中的用户动作之后，还包括：