[发明专利]基于对抗训练的领域语音识别训练方法在审

申请号：	201810397535.5	申请日：	2018-04-27
公开（公告）号：	CN108597502A	公开（公告）日：	2018-09-28
发明（设计）人：	宋荣	申请（专利权）人：	上海适享文化传播有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/26;G06F17/27
代理公司：	暂无信息	代理人：	暂无信息
地址：	200000 上***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于对抗训练的领域语音识别训练方法，为了提高计算机对语音的识别率而设计。本发明基于对抗训练的领域语音识别训练方法包括：输入一个音频文件作为训练输入；分别通过通用语音引擎和领域语音模型识别文本；领域识别模型，按照输入的初步文本确定语音最有可能对应的2个领域；按照匹配的领域，利用各自的领域模型进行文本转换；匹配两个领域语音模型输入文本和原始输入文本的近似度，选择高匹配结果；然后比对通用语音识别的结果和领域语音模型识别的结果.如果结果不匹配，把训练结果和对应语音导入领域特征库，开始下一次迭代训练整体模型的匹配程度达到目标后，完成领域语音识别模型的训练。
搜索关键词：	语音识别匹配对抗训练语音模型输入文本通用语音语音文本领域模型领域识别领域特征匹配结果文本转换训练结果一次迭代音频文件整体模型近似度识别率比对引擎计算机
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于对抗训练的领域语音识别训练方法，其特征在于，包括：输入一个音频文件作为训练输入；分别通过通用语音引擎和领域语音模型识别语音并转化为初步文本；基于文本主题模型Topic Model，按照输入的初步文本确定语音最有可能对应的2个领域；按照匹配的领域，利用各自的领域模型进行语音到文本的转换，得到语音输入的领域识别的文本版本；分别计算两个领域语音模型输出的文本和原始音频文件的对应输入文本的近似度，选择高匹配结果；文本近似度基于语料库的词向量(Word Embedding)分数的求和后泛化计算得出；利用文本近似度做为领域模型的损失函数，记为D_领域；同时利用词向量语料库，计算通用模型产生的文本和原始音频文件对应文本的近似度，记为D_通用；每次训练迭代，同时优化一次通用模型和领域模型，通用模型会根据原始语音输入产生不同的识别文本，同时领域模型会根据领域纠错后也产生新的文本，每次迭代，同时优化两个损失函数；整体模型是通用模型和领域模型识别对抗的结果，多次迭代后，两个损失函数产生收敛性，从而得到最终结果，完成领域语音识别模型的训练。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海适享文化传播有限公司，未经上海适享文化传播有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810397535.5/，转载请声明来源钻瓜专利网。

上一篇：一种基于残差网络和双向门控循环单元的视听语音模型
下一篇：测试语料生成方法、装置、设备及可读写存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于对抗训练的领域语音识别训练方法在审

专利文献下载