[发明专利]基于识别模型的识别方法、模型训练方法及装置有效
申请号: | 202010659647.0 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111539495B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 赵泽宇;李科;黄宇凯;郝玉峰;邵志明;张卫强 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司;清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 识别 模型 方法 训练 装置 | ||
1.一种基于识别模型的识别方法,其特征在于,所述识别模型包括特征提取模块,所述特征提取模块包括多个LSTM单元,所述识别方法包括:
获取待识别特征序列,所述待识别特征序列包括连续的特征,且所述待识别特征序列包括具有时间顺序性的以下一个或几个序列:语音片段、视频片段或文本;
将多个特征依序分别输入至所述多个LSTM单元,通过每个所述LSTM单元得到所述特征对应的第一隐藏状态;
基于所述多个特征,以及所述多个特征分别对应的第一隐藏状态,以及所述特征提取模块的前次输出结果,得到所述特征提取模块的当前输出结果;
基于所述特征提取模块的当前输出结果,得到识别结果;
其中,所述基于所述多个特征,以及所述多个特征分别对应的第一隐藏状态,以及所述特征提取模块的前次输出结果,得到所述特征提取模块的当前输出结果,包括:
基于所述多个特征,得到所述特征提取模块的当前输入特征;
基于所述特征提取模块的当前输入特征、所述特征提取模块的前次输出结果,以及所述多个特征分别对应的第一隐藏状态,得到所述特征提取模块的隐藏状态;
基于所述特征提取模块的隐藏状态,得到所述特征提取模块的当前输出结果。
2.根据权利要求1所述的基于识别模型的识别方法,其特征在于,所述识别方法还包括:
确定所述特征的前次第一隐藏状态;
所述将多个特征依序分别输入至所述多个LSTM单元,通过每个所述LSTM单元得到所述特征对应的第一隐藏状态,包括:
基于所述特征,确定所述特征对应的第一输入门信号、第一遗忘门信号和第一原始隐藏状态;
基于所述第一输入门信号、所述第一遗忘门信号、所述第一原始隐藏状态和所述特征的前次第一隐藏状态,得到所述特征对应的第一隐藏状态。
3.根据权利要求2所述的基于识别模型的识别方法,其特征在于,所述识别方法还包括:
确定所述特征的前次输出结果;
所述基于所述特征,确定所述特征对应的第一输入门信号、第一遗忘门信号和第一原始隐藏状态,包括:
基于所述特征,以及所述特征的前次输出结果,得到所述特征对应的所述第一输入门信号、所述第一遗忘门信号和所述第一原始隐藏状态。
4.根据权利要求3所述的基于识别模型的识别方法,其特征在于,所述识别方法还包括:
基于所述特征,以及所述特征的前次输出结果,得到所述特征对应的第一输出门信号;
基于所述第一输出门信号和所述特征对应的第一隐藏状态,得到所述特征的当前输出结果。
5.根据权利要求1所述的基于识别模型的识别方法,其特征在于,所述基于所述多个特征,得到所述特征提取模块的当前输入特征,通过以下方式确定:
其中,为所述特征提取模块的当前输入特征;为所述特征。
6.根据权利要求1所述的基于识别模型的识别方法,其特征在于,所述识别方法还包括:
确定所述特征提取模块的前次隐藏状态;
所述基于所述特征提取模块的当前输入特征、所述特征提取模块的前次输出结果,以及所述多个特征分别对应的第一隐藏状态,得到所述特征提取模块的隐藏状态,包括:
基于所述特征提取模块的当前输入特征和所述特征提取模块的前次输出结果,得到所述特征提取模块对应的第二输入门信号和第二遗忘门信号;
基于所述多个特征分别对应的第一隐藏状态、所述第二输入门信号、第二遗忘门信号和所述特征提取模块的前次隐藏状态,得到所述特征提取模块的隐藏状态。
7.根据权利要求6所述的基于识别模型的识别方法,其特征在于,所述基于所述多个特征分别对应的第一隐藏状态、所述第二输入门信号、第二遗忘门信号和所述特征提取模块的前次隐藏状态,得到所述特征提取模块的隐藏状态,包括:
基于所述多个特征分别对应的第一隐藏状态,得到所述特征提取模块的原始隐藏状态;
基于所述特征提取模块的原始隐藏状态、所述第二输入门信号、所述第二遗忘门信号和所述特征提取模块的前次隐藏状态,得到所述特征提取模块的隐藏状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司;清华大学,未经北京海天瑞声科技股份有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010659647.0/1.html,转载请声明来源钻瓜专利网。