[发明专利]一种动态反向解码的方法、装置及可读存储介质有效
| 申请号: | 201910233355.8 | 申请日: | 2019-03-26 | 
| 公开(公告)号: | CN110110294B | 公开(公告)日: | 2021-02-02 | 
| 发明(设计)人: | 吴帅;李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 | 
| 主分类号: | G06F40/151 | 分类号: | G06F40/151 | 
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 | 
| 地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 动态 反向 解码 方法 装置 可读 存储 介质 | ||
1.一种动态反向解码的方法,其特征在于,所述方法包括:
读入n元正向语言模型和m元反向语言模型;
读入待处理数据;
在H个预设时间段中的第1个预设时段内,通过所述n元正向语言模型对所述待处理数据进行处理,得到候选结果;
在所述第1个预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格的首部;
依次取h为从2至H的整数,执行以下步骤:
在所述H个预设时间段中的第h个预设时间段内,通过所述n元正向语言模型继续对所述待处理数据进行处理,得到候选结果;
在所述第h个所述预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格首部;
通过所述m元反向语言模型对在第h-1个预设时间段结束时添加到词网格的首部的多个候选结果的权重评分进行更新,得到更新后的结果;
遍历所述更新后的结果所对应的路径和所述权重评分较大的多个候选结果所对应的路径,并从中确定最佳路径;
根据所述最佳路径输出解码结果,其中,n、m、h、H分别为大于等于1的整数;
其中,在H个预设时间段中的第1个预设时段内,通过所述n元正向语言模型对所述待处理数据进行处理,得到候选结果,包括:
将所述H个预设时间段设置为符合低延时条件的多个长度相等的时间段,所述预设时间段以帧为时间单位;
在所述多个长度相等的时间段中的第1个时间段内,通过所述n元正向语言模型接收所述待处理数据,根据该待处理数据的前文信息计算解码每个词汇的概率,并将概率不为零的词汇确定为所述候选结果;
其中,遍历所述更新后的结果所对应的路径和所述权重评分较大的多个候选结果所对应的路径,并从中确定最佳路径,包括:
遍历所述更新后的结果所对应的路径的第一权重评分和所述多个候选结果所对应的路径的第二权重评分;
对比所述第一权重评分和所述第二权重评分,得到最大权重评分;
将所述最大权重评分对应的路径确定为最佳路径;
其中,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格首部,包括:
设置权重评分阈值;
在所述第1个预设时间段结束时,遍历所述候选结果,将权重评分大于所述权重评分阈值的候选结果确定为有效候选结果;
将所述有效候选结果添加到词网格的首部。
2.如权利要求1所述的方法,其特征在于,通过所述m元反向语言模型对在第h-1个预设时间段结束时添加到词网格的首部的多个候选结果的权重评分进行更新,得到更新后的结果,包括:
通过所述m元反向语言模型计算在第h-1个时间段结束时添加到词网格的首部的多个候选结果的概率值;
通过所述m元反向语言模型利用所述概率值计算所述多个候选结果的权重分数。
3.如权利要求1所述的方法,其特征在于,在根据所述最佳路径输出解码结果的同时,所述方法还包括:
检测所述词网格的长度,并判断该词网格的长度是否大于n;
将长度大于n的所述词网格从尾部裁剪一单元长度;
在下一次生成解码结果时,解码输出该裁剪的单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233355.8/1.html,转载请声明来源钻瓜专利网。





