[发明专利]设备唤醒方法、装置及电子设备在审
| 申请号: | 202211336494.1 | 申请日: | 2022-10-28 |
| 公开(公告)号: | CN115862614A | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 宿绍勋 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L15/26;G10L15/06 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
| 地址: | 100015 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 设备 唤醒 方法 装置 电子设备 | ||
1.一种设备唤醒方法,其特征在于,所述方法包括:
基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定;其中,所述唤醒判定用于确定是否唤醒设备,所述误唤醒判定用于对所述唤醒判定进行唤醒纠错;
基于所述唤醒判定的结果和所述误唤醒判定的结果,确定是否唤醒所述设备。
2.根据权利要求1所述的方法,其特征在于,所述基于当前采集到的语音数据,进行所述误唤醒判定;包括:
对所述当前采集到的语音数据进行至少一种分析维度的初判定,所述初判定用于初步确定是否为误唤醒;
基于所述至少一种分析维度各自对应的判定结果,进行所述误唤醒判定。
3.根据权利要求2所述的方法,其特征在于,所述分析维度包括:语音内容维度,所述对所述当前采集到的语音数据进行至少一种分析维度的初判定,包括:
从所述当前采集到的语音数据中提取语音向量特征;
获取多个预设向量特征,其中,所述预设向量特征为预先确定的非唤醒的语音数据对应的向量特征;
基于所述语音向量特征分别与多个预设向量特征之间的相似度,从所述语音内容维度判定是否为误唤醒。
4.根据权利要求2或3所述的方法,其特征在于,所述分析维度包括语境维度;所述对所述当前采集到的语音数据进行至少一种分析维度的初判定,包括:
对所述当前采集到的语音数据进行文本识别,得到多个文本词;
基于多个所述文本词,获取语义特征,所述语义特征用于表征各个所述文本词之间的相关性程度;
基于所述语义特征,从所述语境维度判定是否为误唤醒。
5.根据权利要求4所述的方法,其特征在于,所述对所述当前采集到的语音数据进行内容识别,得到多个文本词之后,所述方法还包括:
基于所述当前采集的语音数据的时间,获取多个所述文本词各自对应的采集时间;
基于多个所述文本词各自对应的采集时间,确定所述当前采集的语音数据对应的时间特征,所述时间特征用于表征多个所述文本词之间的时间连续程度;
基于所述语义特征,从所述语境维度判定是否为误唤醒,包括:
基于所述语义特征和所述时间特征,从所述语境维度判定是否为误唤醒。
6.根据权利要求5所述的方法,其特征在于,所述基于多个所述文本词各自对应的采集时间,确定所述当前采集的语音数据对应的时间特征,包括:
从多个所述文本词中,确定目标词;其中,所述目标词为与所述设备的唤醒词对应的文本词;
基于多个所述文本词各自对应的采集时间,确定所述目标词与其他所述文本词之间的第一时间间隔,将所述第一时间间隔确定为所述时间特征;和/或,
基于多个所述文本词各自对应的采集时间,确定每相邻的两个所述文本词之间的第二时间间隔,将所述第二时间间隔确定为所述时间特征;
其中,其他所述文本词为除所述目标词外的任一文本词。
7.根据权利要求1或2所述的方法,其特征在于,基于当前采集到的语音数据,分别进行唤醒判定和误唤醒判定,包括:
将所述当前采集到的语音数据分别输入至唤醒模型和误唤醒模型,以通过所述唤醒模型进行所述唤醒判定,通过所述误唤醒模型进行所述误唤醒判定;
其中,所述唤醒模型是以多个唤醒语音数据为训练样本训练得到的,所述误唤醒模型是以多个误唤醒的语音数据样本为训练样本训练得到的。
8.根据权利要求7所述的方法,其特征在于,所述误唤醒的语音数据样本的获取,包括:
在每成功唤醒所述设备时,对唤醒所述设备的第一语音数据进行缓存;
从至少一个所述第一语音数据中,确定属于误唤醒的第二语音数据;
将所述第二语音数据作为所述误唤醒的语音数据样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211336494.1/1.html,转载请声明来源钻瓜专利网。





