[发明专利]一种代码纠错方法、装置、电子设备及存储介质在审
| 申请号: | 202210208542.2 | 申请日: | 2022-03-04 |
| 公开(公告)号: | CN114579184A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 刘沐阳 | 申请(专利权)人: | 中国建设银行股份有限公司 |
| 主分类号: | G06F8/75 | 分类号: | G06F8/75 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 孙小明 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 代码 纠错 方法 装置 电子设备 存储 介质 | ||
1.一种代码纠错方法,其特征在于,该方法包括:
在将输入代码进行分词后,确定各分词代码的分词向量;
基于所有分词代码的分词向量,确定各分词代码的隐藏信息;
基于任一级的上下文向量对应的权重信息对所有分词代码的隐藏信息进行加权求和,得到所述输入代码的所述级的上下文向量;
基于所述输入代码的各级上下文向量,从预设的可选向量中选择目标向量序列;
将所述目标向量序列中各向量转为目标分词代码后,将目标分词代码按所述目标向量序列中向量的顺序进行组合,得到目标代码。
2.如权利要求1所述的方法,其特征在于,基于所有分词代码的分词向量,确定各分词代码的隐藏信息,包括:
基于第一预设隐藏信息以及第一分词代码的分词向量,确定第一分词代码的隐藏信息;其中,所述第一分词代码为基于分词代码在所述输入代码中的顺序确定的第一个分词代码;以及
针对除所述第一分词代码之外的任一其他分词代码,基于所述其他分词代码的分词向量以及上一分词代码的隐藏信息,确定所述其他分词代码的隐藏信息;其中,所述上一分词代码为基于分词代码在所述输入代码中的顺序确定的所述其他分词代码的上一个分词代码。
3.如权利要求1所述的方法,其特征在于,基于所述输入代码的各级上下文向量,从预设的可选向量中选择目标向量序列,包括:
基于第二预设隐藏信息,所述各级上下文向量以及预设起始符,从可选向量中选择各级目标向量;
基于各级目标向量确定目标向量序列。
4.如权利要求3所述的方法,其特征在于,若有多个第二预设隐藏信息,和/或多个预设起始符,则基于第二预设隐藏信息,所述各级上下文向量以及预设起始符,从可选向量中选择各级目标向量,包括:
基于第N-1级隐藏信息,第N级的上下文向量,以及第N-1级目标向量,确定第N级隐藏信息;其中,若N=1,则第N-1级目标向量为任一预设起始符,第N-1级隐藏信息为任一第二预设隐藏信息;
基于第N级隐藏信息,第N级的上下文向量,以及第N-1级目标向量,确定各可选向量在第N级的输出概率;
从所有可选向量中选择在第N级的输出概率最高的可选向量作为第N级目标向量;
基于各级目标向量确定目标向量序列,包括:
将所有目标向量按所在级进行排序,得到所述第二预设隐藏信息以及所述预设起始符对应的目标向量序列。
5.如权利要求3所述的方法,其特征在于,若有一个第二预设隐藏信息,以及一个预设起始符,则基于第二预设隐藏信息,所述各级上下文向量以及预设起始符,从可选向量中选择各级目标向量,包括:
基于所述第二预设隐藏信息,第一级的上下文向量,以及所述预设起始符,确定第一级隐藏信息;
基于第一级隐藏信息,第一级的上下文向量,以及所述预设起始符,确定各可选向量在第一级的输出概率;
根据各可选向量在第一级的输出概率,从所有可选向量中选择预设数量的可选向量,作为第一级目标向量;
针对任一第一级目标向量,基于第N级隐藏信息,第N级的上下文向量,以及第N-1级目标向量,确定各可选向量在第N级的输出概率;其中,N≥2,第N级隐藏信息是基于第N-1级隐藏信息,第N级的上下文向量,以及第N-1级目标向量确定的;
从所有可选向量中选择在第N级的输出概率最高的可选向量作为第N级目标向量;
基于各级目标向量确定目标向量序列,包括:
针对任一第一级目标向量,将所述第一级目标向量以及所述第一级目标向量对应的其他级目标向量按所在级进行排序,得到所述第一级目标向量对应的目标向量序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210208542.2/1.html,转载请声明来源钻瓜专利网。





