[发明专利]语音语义识别模型构建方法、语义识别方法、装置及设备在审
申请号: | 202010938197.9 | 申请日: | 2020-09-08 |
公开(公告)号: | CN112017638A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 符文君 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 王卫忠;沈园园 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 语义 识别 模型 构建 方法 装置 设备 | ||
1.一种语音语义识别模型构建方法,其特征在于,包括:
从语音样本信号中提取语音特征;
根据预设选取规则在所述语音特征中随机选取特征值进行隐码操作;
将经过隐码操作后的语音特征输入至预构建的语音语义识别模型,其中,所述预构建的语音语义识别模型包括:编码层、第一解码层以及第二解码层;
通过所述编码层对经过隐码操作后的语音特征进行编码,获取编码结果;
将所述编码结果输入至所述第一解码层,对所述编码结果解码后,基于解码结果生成所述语音特征属于预配置的第i语义标签对应的第一条件概率;
以及,将所述编码结果输入至所述第二解码层,对所述编码结果解码后,基于解码结果生成所述语音特征属于所述第i语义标签对应的第二条件概率,i为正整数;
当根据所述第一条件概率和所述第二条件概率,确定所述语音语义识别模型满足预设要求时,确定所述语音语义识别模型构建完成。
2.根据权利要求1所述的方法,其特征在于,根据所述第一条件概率和所述第二条件概率,确定所述语音语义识别模型是否满足预设要求,具体包括:
根据所述第一条件概率和所述第二条件概率,生成验证数值;
确定所述验证数值与参考值之间的差值,当所述差值符合所述预设要求时,确定所述语音语义识别模型满足预设要求,所述语音语义识别模型构建完成。
3.根据权利要求1或2所述的方法,其特征在于,所述根据预设选取规则在所述语音特征中随机选取特征值进行隐码操作,具体包括:
根据所述语音特征,生成语音特征频谱图;
从所述频谱图中随机选取目标图像区域,对所述目标图像区域中的特征值进行隐码;
和/或,以所述频谱图对应的时间维度为基准,随机选取目标时间区域,对处于所述目标时间区域中的特征值进行隐码;
和/或,以所述频谱图对应的频率维度为基准,随机选取目标频率区域,对处于所述目标频率区域中的特征值进行隐码。
4.根据权利要求1或2所述的方法,其特征在于,所述通过所述编码层对经过隐码操作后的语音特征进行编码,获取编码结果之前,所述方法还包括:
对经过隐码操作后的语音特征进行降采样操作。
5.一种语义识别方法,其特征在于,所述方法包括:
从待识别语音信号中提取语音特征;
将所述语音特征输入至如权利要求1-4任一项所述的方法构建的语音语义识别模型的编码层中,获取编码结果;
在第一解码层中对上述编码结果进行解码,并基于解码结果确定所述语音特征在第n维度上的第i个语义标签,与所述编码结果以及预获取的第1维度到第n-1维度上所有目标语义标签之间的第一条件概率;
在第二解码层中对上述编码结果进行解码,并基于解码结果确定所述语音特征在第n维度上的第i个语义标签,与所述编码结果以及预获取的第1维度到第n-1维度上所有目标语义标签之间的第二条件概率;
根据所述第一条件概率和所述第二条件概率,确定所述语音特征在第n维度上的第i个语义标签对应的标签分值;
从所有语义标签分别对应的标签分值中,确定标签分值最大的语义标签为所述语音特征在第n维度上的语义标签,其中,所述i为正整数,n为大于2的正整数,第一维度上的目标语义标签直接根据所述语音特征获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010938197.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能广谱性杀虫剂及其制备方法
- 下一篇:一种组装式雷达卫星三角反射器