[发明专利]基于对抗训练的领域语音识别训练方法在审
| 申请号: | 201810397535.5 | 申请日: | 2018-04-27 |
| 公开(公告)号: | CN108597502A | 公开(公告)日: | 2018-09-28 |
| 发明(设计)人: | 宋荣 | 申请(专利权)人: | 上海适享文化传播有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G06F17/27 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200000 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音识别 匹配 对抗训练 语音模型 输入文本 通用语音 语音 文本 领域模型 领域识别 领域特征 匹配结果 文本转换 训练结果 一次迭代 音频文件 整体模型 近似度 识别率 比对 引擎 计算机 | ||
1.一种基于对抗训练的领域语音识别训练方法,其特征在于,包括:
输入一个音频文件作为训练输入;
分别通过通用语音引擎和领域语音模型识别语音并转化为初步文本;
基于文本主题模型Topic Model,按照输入的初步文本确定语音最有可能对应的2个领域;
按照匹配的领域,利用各自的领域模型进行语音到文本的转换,得到语音输入的领域识别的文本版本;
分别计算两个领域语音模型输出的文本和原始音频文件的对应输入文本的近似度,选择高匹配结果;
文本近似度基于语料库的词向量(Word Embedding)分数的求和后泛化计算得出;利用文本近似度做为领域模型的损失函数,记为D_领域;
同时利用词向量语料库,计算通用模型产生的文本和原始音频文件对应文本的近似度,记为D_通用;
每次训练迭代,同时优化一次通用模型和领域模型,通用模型会根据原始语音输入产生不同的识别文本,同时领域模型会根据领域纠错后也产生新的文本,每次迭代,同时优化两个损失函数;
整体模型是通用模型和领域模型识别对抗的结果,多次迭代后,两个损失函数产生收敛性,从而得到最终结果,完成领域语音识别模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海适享文化传播有限公司,未经上海适享文化传播有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810397535.5/1.html,转载请声明来源钻瓜专利网。





