[发明专利]语音识别模型的训练测试方法、装置、设备及存储介质在审
| 申请号: | 202011169279.8 | 申请日: | 2020-10-28 |
| 公开(公告)号: | CN112309375A | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | 吕翔;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/16;G10L15/22;G10L15/26 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 模型 训练 测试 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能领域,公开了一种语音识别模型的训练测试方法、装置、设备及存储介质,用于解决模型训练时需要大量标签数据的问题以及提高模型训练的效率。语音识别模型的训练测试方法包括:获取多个历史语音片段、多个有标签语音片段和多个无标签语音片段;进行特征提取,得到历史观测序列、有标签观测序列以及无标签观测序列;根据历史观测序列和有标签观测序列训练模型;根据历史观测序列和无标签观测序列优化模型,得到候选分类器模型和候选重构器模型;获取测试语音数据,根据测试语音数据、候选分类器模型和候选重构器模型得到目标分类器模型和目标重构器模型,此外,本发明还涉及区块链技术,无标签语音片段可存储于区块链中。
技术领域
本发明涉及语音识别领域,尤其涉及一种语音识别模型的训练测试方法、装置、设备及存储介质。
背景技术
说话人分离技术是指基于一段多人语音,将其分割为若干个片段,并标记每个片段所归属的说话人标签的技术。
在现有技术中,应用深度神经网络结合长短期记忆网络对大量带有标签的数据进行模型训练,从而将待识别数据输入训练好的模型中进行对象识别(为待识别数据标记说话人的标签),得到说话人标签。现有技术在建模的过程需要大量的有标签数据进行训练,但是实际上大部分数据都是无标签数据,对无标签数据进行模型训练时还需要提前对无标签数据进行标记,导致训练模型的效率较低。
发明内容
本发明的主要目的在于解决在训练识别模型时,需要大量有标签的数据且训练效率较低的问题。
本发明第一方面提供了一种语音识别模型的训练测试方法,包括:获取多个历史语音片段、多个有标签语音片段和多个无标签语音片段,所述多个历史语音片段、所述多个有标签语音片段和所述多个无标签语音片段由至少一个说话对象发出;对所述多个历史语音片段进行特征提取,得到历史观测序列,对所述多个有标签语音片段进行特征提取,得到有标签观测序列以及对所述多个无标签语音数据进行特征提取,得到无标签观测序列;根据所述历史观测序列和所述有标签观测序列训练初始分类器模型和初始重构器模型;根据所述历史观测序列和所述无标签观测序列,分别优化所述初始分类器模型和初始重构器模型,得到候选分类器模型和候选重构器模型;获取测试语音数据,根据所述测试语音数据、所述候选分类模型中和所述候选重构器模型得到测试标签,并基于所述测试标签调整所述候选分类器模型和所述候选重构器模型,得到目标分类器模型和目标重构器模型。
可选的,在本发明第一方面的第一种实现方式中,所述根据所述历史观测序列和所述有标签观测序列训练初始分类器模型和初始重构器模型包括:采用循环神经网络对所述历史观测序列进行训练,得到历史状态模型;将所述历史观测序列中的每个历史语音特征输入所述历史状态模型中进行状态识别,确定与每个历史语音特征对应的历史状态,生成多个历史状态,每个说话对象对应一个历史状态或者多个历史状态;基于所述有标签观测序列和所述多个历史状态训练得到初始分类器模型;基于所述有标签观测序列训练得到初始重构器模型。
可选的,在本发明第一方面的第二种实现方式中,所述基于所述有标签观测序列和所述多个历史状态训练得到初始分类器模型包括:从所述有标签观测序列中提取多个原始有标签语音特征,对每个原始有标签语音特征和多个历史状态进行仿射变换,得到与每个原始有标签语音特征对应的组合有标签语音特征;将每个组合有标签语音特征映射至预置的对象类别概率空间,得到与每个组合有标签语音特征对应的第一对象标签以及与每个组合有标签语音特征对应的第一标签概率,所述第一标签概率为所述第一对象标签属于目标说话对象的概率;根据每个第一对象标签以及对应的第一标签概率训练模型,得到初始分类器模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011169279.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于气动肌肉技术的巨型长石分割设备
- 下一篇:显示面板及其制作方法





