[发明专利]用于唤醒电子设备的方法和装置有效
申请号: | 201910462512.2 | 申请日: | 2019-05-30 |
公开(公告)号: | CN111768771B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 白二伟 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 唤醒 电子设备 方法 装置 | ||
本申请实施例公开了用于唤醒电子设备的方法和装置。该方法的一具体实施方式包括:获取用于设置自定义唤醒词的第一音频数据,以及对该第一音频数据进行时频变换生成第一频谱数据;根据该第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,其中,频谱转换参数用于表征指示相同语义的不同频谱数据之间的转换关系;对该第二频谱数据进行时频逆变换,生成该第二音频数据;基于该第二音频数据,建立该自定义唤醒词对应的音频数据集合,其中,该音频数据集合用于确定是否唤醒电子设备。该实施方式实现了用户自定义设置唤醒词,从而可以提供新的唤醒电子设备的方式。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于唤醒电子设备的方法和装置。
背景技术
随着物联网技术的飞速发展,越来越多的电子设备接入到网络中。语音交互渐渐代替了鼠标、手机等输入设备,成为控制电子设备的主流方式。目前具有语音交互功能的电子设备多种多样,例如智能音箱等。
在语音交互技术中,首先进入人机交互的是唤醒技术。一般情况下,电子设备可以由厂家设定唤醒词。用户使用的时候,需要发出厂家设定的唤醒词的语音,以唤醒电子设备。
发明内容
本申请实施例提出了用于唤醒电子设备的方法和装置。
第一方面,本申请实施例提供了一种用于唤醒电子设备的方法,该方法包括:获取用于设置自定义唤醒词的第一音频数据,以及对上述第一音频数据进行时频变换生成第一频谱数据;根据上述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,其中,频谱转换参数用于表征指示相同语义的不同频谱数据之间的转换关系;对上述第二频谱数据进行时频逆变换,生成上述第二音频数据;基于上述第二音频数据,建立上述自定义唤醒词对应的音频数据集合,其中,上述音频数据集合用于确定是否唤醒电子设备。
在一些实施例中,上述方法包括:响应于获取到待确定音频数据,确定上述待确定音频数据是否与上述音频数据集合中的音频数据匹配;响应于确定上述待确定音频数据与上述音频数据集合中的音频数据匹配,唤醒上述电子设备。
在一些实施例中,获取第三音频数据集合,其中,上述第三音频数据集合中的第三音频数据与声源距离对应,声源距离为声源与第一采集端之间的距离;对上述第三音频数据集合中的第三音频数据进行时频变换,生成第三频谱数据集合;根据上述第三频谱数据集合,生成频谱转换参数集合。
在一些实施例中,上述根据上述第三频谱数据集合,生成频谱转换参数集合,包括:从上述第三音频数据集合中的第三音频数据对应的声源距离中,获取声源距离对,其中,所获取的声源距离对包括第一声源距离和第二声源距离;根据上述第一声源距离对应的第三频谱数据和上述第二声源距离对应的第三频谱数据,生成上述声源距离对的频谱转换参数。
在一些实施例中,上述根据上述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,包括:根据上述第一音频数据进行声源定位,确定上述第一音频数据对应的声源与第二采集端之间的定位距离;从频谱转换参数集合中,查找与上述定位距离相匹配的声源距离对的频谱转换参数;根据查找出的频谱转换参数和上述第一频谱数据,生成第二频谱数据。
在一些实施例中,上述第三音频数据集合包括近场第三音频数据和远场第三音频数据;以及上述根据上述第三频谱数据集合,生成频谱转换参数集合,包括:根据近场第三频谱数据和远场声源距离对应的远场第三频谱数据,生成与上述远场声源距离对应的频谱转换参数,其中,近场第三频谱数据由近场第三音频数据时频变换生成。
在一些实施例中,上述获取用于设置自定义唤醒词的第一音频数据,以及对上述第一音频数据进行时频变换生成第一频谱数据包括:获取用于设置自定义唤醒词的近场第一音频数据,以及根据上述近场第一音频数据生成的近场第一频谱数据;以及上述根据上述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,包括:根据上述近场第一频谱数据和与远场声源距离对应的频谱转换参数,生成与上述远场声源距离对应的远场第二音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910462512.2/2.html,转载请声明来源钻瓜专利网。