[发明专利]语音识别模型的训练测试方法、装置、设备及存储介质在审

专利信息
申请号: 202011169279.8 申请日: 2020-10-28
公开(公告)号: CN112309375A 公开(公告)日: 2021-02-02
发明(设计)人: 吕翔;马骏;王少军 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/02;G10L15/16;G10L15/22;G10L15/26
代理公司: 北京市京大律师事务所 11321 代理人: 姚维
地址: 518033 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 模型 训练 测试 方法 装置 设备 存储 介质
【权利要求书】:

1.一种语音识别模型的训练测试方法,其特征在于,所述语音识别模型的训练测试方法包括:

获取多个历史语音片段、多个有标签语音片段和多个无标签语音片段,所述多个历史语音片段、所述多个有标签语音片段和所述多个无标签语音片段由至少一个说话对象发出;

对所述多个历史语音片段进行特征提取,得到历史观测序列,对所述多个有标签语音片段进行特征提取,得到有标签观测序列以及对所述多个无标签语音数据进行特征提取,得到无标签观测序列;

根据所述历史观测序列和所述有标签观测序列训练初始分类器模型和初始重构器模型;

根据所述历史观测序列和所述无标签观测序列,分别优化所述初始分类器模型和初始重构器模型,得到候选分类器模型和候选重构器模型;

获取测试语音数据,根据所述测试语音数据、所述候选分类模型中和所述候选重构器模型得到测试标签,并基于所述测试标签调整所述候选分类器模型和所述候选重构器模型,得到目标分类器模型和目标重构器模型。

2.根据权利要求1所述的语音识别模型的训练测试方法,其特征在于,所述根据所述历史观测序列和所述有标签观测序列训练初始分类器模型和初始重构器模型包括:

采用循环神经网络对所述历史观测序列进行训练,得到历史状态模型;

将所述历史观测序列中的每个历史语音特征输入所述历史状态模型中进行状态识别,确定与每个历史语音特征对应的历史状态,生成多个历史状态,每个说话对象对应一个历史状态或者多个历史状态;

基于所述有标签观测序列和所述多个历史状态训练得到初始分类器模型;

基于所述有标签观测序列训练得到初始重构器模型。

3.根据权利要求2所述的语音识别模型的训练测试方法,其特征在于,所述基于所述有标签观测序列和所述多个历史状态训练得到初始分类器模型包括:

从所述有标签观测序列中提取多个原始有标签语音特征,对每个原始有标签语音特征和多个历史状态进行仿射变换,得到与每个原始有标签语音特征对应的组合有标签语音特征;

将每个组合有标签语音特征映射至预置的对象类别概率空间,得到与每个组合有标签语音特征对应的第一对象标签以及与每个组合有标签语音特征对应的第一标签概率,所述第一标签概率为所述第一对象标签属于目标说话对象的概率;

根据每个第一对象标签以及对应的第一标签概率训练模型,得到初始分类器模型。

4.根据权利要求3所述的语音识别模型的训练测试方法,其特征在于,所述基于所述有标签观测序列训练得到初始重构器模型包括:

提取有标签观测序列的高斯概率分布,并采用所述高斯概率分布进行模型预训练,得到预训练重构器模型;

将每个原始有标签语音特征输入所述预训练重构器模型中进行识别,得到与每个原始有标签语音特征对应的第二对象标签以及与每个原始有标签语音特征对应的第二标签概率,所述第二标签概率为所述第二对象标签属于目标说话对象的概率;

提取每个说话对象预置的正态分布,判断每个第二标签概率是否符合所述高斯概率分布以及判断所述高斯概率分布的高斯均值是否符合所述说话对象正态分布;

若目标第二标签概率符合所述高斯概率分布且所述高斯均值符合所述说话对象正态分布,则确定所述预训练重构器模型为初始重构器模型;

若目标第二标签概率不符合所述高斯概率分布且所述高斯均值不符合所述说话对象正态分布,则基于目标原始有标签语音特征调整所述预训练重构器模型,得到初始重构器模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011169279.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top