[发明专利]一种系统唤醒方法及装置有效
申请号: | 201911414856.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111192588B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 梁飞宇 | 申请(专利权)人: | 深圳市瑞讯云技术有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L17/02;G10L17/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘冬亮 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 系统 唤醒 方法 装置 | ||
1.一种系统唤醒方法,其特征在于,应用于人工智能系统,所述方法包括:
当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;
获取所述处理语音信息的声学特征;
确定所述声学特征与预存数据库的特征是否相同;
若所述声学特征与预存数据库的声学特征相同,则判断所述处理语音信息是否包含唤醒信息;
若所述处理语音信息包含唤醒信息,则执行唤醒操作;
其中,所述唤醒信息包括唤醒字词和语音间隙,所述判断所述处理语音信息是否包含唤醒信息,包括:
识别所述语音信息的语音字词;
判断所述语音字词是否包含多个唤醒字词;
若所述语音字词包含多个唤醒字词,则判断所述多个唤醒字词相互之间是否存在语音间隙;
所述若所述处理语音信息包含唤醒信息,则执行唤醒操作,包括:
若所述多个唤醒字词相互之间不存在语音间隙,则确定所述处理语音信息包含唤醒信息,并执行唤醒操作。
2.根据权利要求1所述的方法,其特征在于,所述声学特征包括:时间长度、共振峰和基频;所述获取所述处理语音信息的声学特征,包括:
获取所述处理语音信息的时间长度;
判断所述时间长度是否大于预设时间长度;
当所述时间长度大于预测时间长度时,则获取所述处理语音信息的共振峰与基频。
3.根据权利要求1所述的方法,其特征在于,所述对所述语音信息进行预处理,包括:
对所述语音信息进行高通滤波,得到滤波信息;
对所述滤波信息进行噪声抑制,得到抑制信息;
对所述抑制信息进行自动增益处理,得到处理语音信息。
4.一种系统唤醒装置,其特征在于,应用于人工智能系统,所述装置包括:
预处理模块,用于当所述人工智能系统处于休眠模式时接收语音信息,并对所述语音信息进行预处理,得到处理语音信息;
获取模块,用于获取所述处理语音信息的声学特征;
确定模块,用于确定所述声学特征与预存数据库的特征是否相同;
判断模块,用于若所述声学特征与预存数据库的特征相同,则判断所述处理语音信息是否包含唤醒信息;
执行模块,用于若所述处理语音信息包含唤醒信息,则执行唤醒操作;
其中,所述唤醒信息包括唤醒字词和语音间隙,所述判断模块包括:
识别模块,用于识别所述语音信息的语音字词;
判断字词模块,用于判断所述语音字词是否包含多个唤醒字词;
判断空格模块,用于若所述语音字词包含多个唤醒字词,则判断所述多个唤醒字词相互之间是否存在语音间隙;
所述执行模块,包括:
唤醒操作模块,用于若所述多个唤醒字词相互之间不存在语音间隙,则确定所述处理语音信息包含唤醒信息,并执行唤醒操作。
5.根据权利要求4所述的装置,其特征在于,所述声学特征包括:时间长度、共振峰和基频;所述获取模块,包括:
获取时间模块,用于获取所述处理语音信息的时间长度;
判断时间模块,用于判断所述时间长度是否大于预设时间长度;
获取信息模块,用于若所述时间长度大于预测时间长度,则获取所述处理语音信息的共振峰与基频。
6.根据权利要求4所述的装置,其特征在于,所述预处理模块,包括:
滤波模块,用于对所述语音信息进行高通滤波,得到滤波信息;
抑制模块,用于对所述滤波信息进行噪声抑制,得到抑制信息;
增益模块,用于对所述抑制信息进行自动增益处理,得到处理语音信息。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如权利要求1至3任一项所述方法。
8.一种计算机可读存储介质,其特征在于,其存储的计算机程序使得处理器执行如权利要求1至3任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市瑞讯云技术有限公司,未经深圳市瑞讯云技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911414856.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:耳标的读码方法及装置
- 下一篇:多租户体系下的用户镜像方法、装置及系统