[发明专利]年龄判别模型训练及智能语音交互方法、设备及存储介质有效
申请号: | 201711365962.7 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108281138B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 陆永帅 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/04;G10L15/16;G10L15/22;G10L21/06 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 年龄 判别 模型 训练 智能 语音 交互 方法 设备 存储 介质 | ||
1.一种年龄判别模型训练方法,其特征在于,包括:
分别获取不同年龄类别的语音数据;
分别按照预定时长对各语音数据进行切分;
分别获取切分得到的各语音数据段的语谱图;所述语谱图为对语音数据段作傅里叶变换后得到的;
将获取到的各语谱图作为样本,将每个样本对应的语音数据的年龄类别作为所述样本的标签;
根据所述样本及标签训练得到年龄判别模型。
2.根据权利要求1所述的方法,其特征在于,
所述分别按照预定时长对各语音数据进行切分包括:
分别对各语音数据按秒进行切分,得到时长为1秒的各语音数据段。
3.根据权利要求1所述的方法,其特征在于,
所述分别按照预定时长对各语音数据进行切分之前,进一步包括:
分别将各语音数据转换为预定格式。
4.根据权利要求1所述的方法,其特征在于,
所述年龄判别模型包括:支持向量机模型、卷积神经网络模型、深度残差网络模型。
5.一种智能语音交互方法,其特征在于,包括:
获取用户向智能语音交互设备输入的语音数据;
按照预定时长对所述语音数据进行切分;
分别获取切分得到的各语音数据段的语谱图;所述语谱图为对语音数据段作傅里叶变换后得到的;
分别将各语谱图输入预先训练得到的年龄判别模型,得到输出的语谱图对应的年龄类别;
根据得到的各年龄类别确定出所述用户的年龄类别;
向所述用户返回与所述用户的年龄类别以及所述语音数据的语音识别结果相对应的服务内容;
其中,所述根据得到的各年龄类别确定出所述用户的年龄类别包括:将得到的各年龄类别中出现次数最多的年龄类别作为所述用户的年龄类别;若得到的各年龄类别中出现次数最多的年龄类别数大于一,则根据所述智能语音交互设备的类型,从出现次数最多的年龄类别中选出一个作为所述用户的年龄类别。
6.根据权利要求5所述的方法,其特征在于,
所述按照预定时长对所述语音数据进行切分包括:
对所述语音数据按秒进行切分,得到时长为1秒的各语音数据段。
7.根据权利要求5所述的方法,其特征在于,
所述按照预定时长对所述语音数据进行切分之前,进一步包括:
将所述语音数据转换为预定格式。
8.一种年龄判别模型训练设备,其特征在于,包括:第一数据获取单元、第一数据切分单元、第一特征提取单元、样本获取单元以及模型训练单元;
所述第一数据获取单元,用于分别获取不同年龄类别的语音数据;
所述第一数据切分单元,用于分别按照预定时长对各语音数据进行切分;
所述第一特征提取单元,用于分别获取切分得到的各语音数据段的语谱图;所述语谱图为对语音数据段作傅里叶变换后得到的;
所述样本获取单元,用于将获取到的各语谱图作为样本,将每个样本对应的语音数据的年龄类别作为所述样本的标签;
所述模型训练单元,用于根据所述样本及标签训练得到年龄判别模型。
9.根据权利要求8所述的设备,其特征在于,
所述第一数据切分单元分别对各语音数据按秒进行切分,得到时长为1秒的各语音数据段。
10.根据权利要求8所述的设备,其特征在于,
所述第一数据切分单元进一步用于,在分别按照预定时长对各语音数据进行切分之前,分别将各语音数据转换为预定格式。
11.根据权利要求8所述的设备,其特征在于,
所述年龄判别模型包括:支持向量机模型、卷积神经网络模型、深度残差网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711365962.7/1.html,转载请声明来源钻瓜专利网。