[发明专利]语音唤醒方法和系统在审
申请号: | 201811081600.X | 申请日: | 2018-09-17 |
公开(公告)号: | CN109036412A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 王欢良;鄢楷强;张宏阳;沈旭晖;马殿昌;李显光 | 申请(专利权)人: | 苏州奇梦者网络科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/20 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 韩凤 |
地址: | 215024 江苏省苏州市工业园区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学特征 现场语音 唤醒 神经网络分类 数据对应 语音帧 预设定 语音 原始语音数据 后验概率 唤醒系统 加窗操作 录入设备 信息输入 语音识别 原始数据 原始语音 阈值比较 置信度 音量 分帧 噪音 场景 | ||
1.一种语音唤醒方法,其特征在于,包括以下步骤:
录入原始音频数据及获取语音录入设备所应用的场景对应的环境音频数据,根据环境音频数据将所述原始音频数据转化为环境语音模拟数据;
对原始语音数据及/或模拟语音数据进行分帧加窗操作,以获取所述原始语音及/或模拟语音对应的语音帧,并提取所述语音帧的声学特征信息;
将所述声学特征信息进行计算,以获取所述语音帧所至少包含的唤醒词类别及非唤醒词类别的深度神经网络分类模型;
录取现场语音数据,提取所述现场语音数据对应的声学特征信息,并将该所述现场语音数据对应的声学特征信息输入至所述深度神经网络分类模型,以得到所述现场语音数据的后验概率信息;
根据所述后验概率信息计算所述录取现场语音数据的置信度,并将所述置信度与预设定阈值比较,当所述置信度大于所述预设定阈值,唤醒语音录入设备,当所述置信度小于所述预设定阈值,不唤醒语音录入设备并进一步获取用户指令。
2.根据权利要求1所述的语音唤醒方法,其特征在于,在所述录入原始音频数据及获取语音录入设备所应用的场景对应的环境音频数据,根据环境音频数据将所述原始音频数据转化为环境语音模拟数据的步骤中,所述环境语音模拟数据包含对原始音频数据的噪声模拟、语速模拟、混响模拟、音调及响度模拟的其中一项或多项。
3.根据权利要求1所述的语音唤醒方法,其特征在于,在所述对原始语音数据及模拟语音数据进行分帧加窗操作,以获取所述原始语音及/或模拟语音对应的语音帧,并提取所述语音帧的声学特征信息的步骤之后,还包括:
对所述语音帧的声学特征信息进行去噪处理。
4.根据权利要求1所述的语音唤醒方法,其特征在于,在所述录取现场语音数据,提取所述现场语音数据对应的声学特征信息,并将该所述现场语音数据对应的声学特征信息输入至所述深度神经网络分类模型,以得到所述现场语音数据的后验概率信息的步骤中,还包括:
对所述现场数据对应的声学特征信息进行去噪处理。
5.一种语音唤醒系统,其特征在于,包括以下系统:
语音数据模拟模块,用以录入原始音频数据及获取语音录入设备所应用的场景对应的环境音频数据,根据环境音频数据将所述原始音频数据转化为环境语音模拟数据;
特征提取模块,用以对原始语音数据及/或模拟语音数据进行分帧加窗操作,以获取所述原始语音及/或模拟语音对应的语音帧,并提取所述语音帧的声学特征信息;
深度网络神经模块,用以将所述声学特征信息进行计算,以获取所述语音帧所至少包含的唤醒词类别及非唤醒词类别的深度神经网络分类模型;
唤醒决策模块,用以录取现场语音数据,提取所述现场语音数据对应的声学特征信息,并将该所述现场语音数据对应的声学特征信息输入至所述深度神经网络分类模型,以得到所述现场语音数据的后验概率信息,根据所述后验概率信息计算所述录取现场语音数据的置信度,并将所述与预设定阈值比较,当所述置信度大于所述预设定阈值,唤醒语音录入设备,当所述置信度小于所述预设定阈值,不唤醒语音录入设备并进一步获取用户指令。
6.根据权利要求5所述的语音唤醒系统,其特征在于,在所述录入原始音频数据及获取语音录入设备所应用的场景对应的环境音频数据,根据环境音频数据将所述原始音频数据转化为环境语音模拟数据的步骤中,所述环境语音模拟数据包含对原始音频数据的噪声模拟、语速模拟、混响模拟、音调及响度模拟的其中一项或多项。
7.根据权利要求5所述的语音唤醒系统,其特征在于,所述系统还包括:
去噪自编码模块,用以对所述语音帧的声学特征信息进行去噪处理。
8.根据权利要求5所述的语音唤醒系统,其特征在于,唤醒决策模块还包括:
去噪单元,用以对所述数据对应的声学特征信息进行去噪处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州奇梦者网络科技有限公司,未经苏州奇梦者网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811081600.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能终端语音交互控制方法及装置
- 下一篇:语音交互方法及终端设备