[发明专利]免唤醒交互方法和装置在审
| 申请号: | 202011625969.X | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112863508A | 公开(公告)日: | 2021-05-28 |
| 发明(设计)人: | 林永楷;樊帅;李春;石韡斯;宋洪博;朱成亚 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 唤醒 交互 方法 装置 | ||
1.一种免唤醒交互方法,包括:
响应于接收到用户的有效语音信号,基于所述有效语音信号所在的时间段确定检测区间;
若在所述检测区间内检测到所述用户的有效指向特征,判断所述有效语音信号和所述有效指向特征是否对应有效指令;
若判断对应有效指令,则对所述有效指令进行处理和反馈。
2.根据权利要求1所述的方法,其中,在若在所述指向区间内检测到所述用户的有效指向特征,结合所述有效语音信号和所述有效指向特征判断是否对应有效指令之前,所述方法还包括:
持续检测视觉信号,当检测的视觉信号的某一时间段出现所述有效指向特征,则将所述某一时间段标记为指向区间;
判断在所述检测区间内是否包含指向区间。
3.根据权利要求1所述的方法,其中,所述方法还包括:
若在所述检测区间内未检测到所述用户的有效指向特征,则进入对所述有效语音信号的唤醒判断。
4.根据权利要求1所述的方法,其中,在判断所述有效语音信号和所述有效指向特征是否对应有效指令之后,所述方法还包括:
若判断不对应有效指令,则进入对所述有效语音信号的唤醒判断。
5.根据权利要求4所述的方法,其中,所述判断所述有效语音信号和所述有效指向特征是否对应有效指令包括:
获取所述有效指向特征指向的内容;
判断所述有效语音信号是否与所述内容相关;
若相关,则确定所述有效语音信号和所述有效指向特征对应有效指令;
若不相关,则确定所述有效语音信号和所述有效指向特征对应无效指令。
6.根据权利要求5所述的方法,其中,所述判断所述有效语音信号是否与所述内容相关包括:
对所述有效语音信号进行语音识别和语义理解,基于语义理解的结果判断所述有效语音信号是否与所述内容相关。
7.根据权利要求5所述的方法,其中,所述内容包括视觉信号流或图片,与所述内容对应的语义理解的意图包括操作智能家居或看图识物。
8.根据权利要求1-7中任一项所述的方法,其中,所述基于所述有效语音信号所在的时间段确定检测区间包括:
基于所述有效语音信号所在的时间段的起始时间点往前回溯第一预设时间形成回溯区间;
基于所述有效语音信号所在的时间端的结束时间点往后保持第二预设时间形成保持区间;
根据所述回溯区间、所述有效语音信号所在的时间段和所述保持区间形成检测区间。
9.一种用于对话系统的多模态输入特征处理方法,包括:
响应于设备被多模态输入特征唤醒,接收所述多模态输入特征和用户语音控制指令;
基于所述多模态输入特征和所述用户语音控制指令形成实际控制指令;
对所述实际控制指令进行响应。
10.一种设备免唤醒交互装置,包括:
信号接收程序模块,配置为响应于接收到有效语音信号,对所述有效语音信号区间采集的图像是否包含有效指向特征进行判断,其中,所述有效指向特征指用户发出的指向动作,包含所述有效指向特征的区间为指向区间;
信号判定程序模块,配置为若判断所述有效语音信号区间包含有效指向特征,则将所述有效语音信号区间的多模态信息输入至对话系统进行是否有效指令判断,其中,多模态信息为包含音频和包含指向动作的图像;
指令响应程序模块,配置为若判断所述多模态信息为有效指令,则响应所述指令并反馈响应结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011625969.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于苗木出圃的临时假植系统
- 下一篇:一种注塑保压设备





