[发明专利]一种代码纠错方法、装置、电子设备及存储介质在审
| 申请号: | 202210208542.2 | 申请日: | 2022-03-04 |
| 公开(公告)号: | CN114579184A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 刘沐阳 | 申请(专利权)人: | 中国建设银行股份有限公司 |
| 主分类号: | G06F8/75 | 分类号: | G06F8/75 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 孙小明 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 代码 纠错 方法 装置 电子设备 存储 介质 | ||
本申请实施例涉及数据处理技术领域,提供了一种代码纠错方法、装置、电子设备及存储介质,该方法包括:在将输入代码进行分词后,确定各分词代码的分词向量;基于所有分词代码的分词向量,确定各分词代码的隐藏信息;基于任一级的上下文向量对应的权重信息对所有分词代码的隐藏信息进行加权求和,得到输入代码的该级的上下文向量;基于各级上下文向量,从预设的可选向量中选择目标向量序列;将目标向量序列中各向量转为目标分词代码后,将目标分词代码按目标向量序列中向量的顺序进行组合,得到目标代码。该方法基于上述上下文向量,精准确定出规范的代码所对应的目标向量序列;将该目标向量序列中的向量转化为代码形式,即可得到规范的目标代码。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种代码纠错方法、装置、电子设备及存储介质。
背景技术
在编码过程中,可能会编写有问题的代码,如内存分配错误,代码冗余,数据库语句设计有缺陷等。需要及时发现并更正错误的代码。
相关技术中,在配置规则后,通过静态分析的方法匹配规则,以确定出不符合规则的代码。
然而,上述修正方法需要手动配置规则,不仅费时费力,而且配置的规则可能不够全面,导致不能精准发现代码错误。
发明内容
本申请实施例提供了一种代码纠错方法、装置、电子设备及存储介质,用以精准、高效地对代码进行纠错。
第一方面,本申请实施例提供了一种代码纠错方法,该方法包括:
在将输入代码进行分词后,确定各分词代码的分词向量;
基于所有分词代码的分词向量,确定各分词代码的隐藏信息;
基于任一级的上下文向量对应的权重信息对所有分词代码的隐藏信息进行加权求和,得到所述输入代码的所述级的上下文向量;
基于所述输入代码的各级上下文向量,从预设的可选向量中选择目标向量序列;
将所述目标向量序列中各向量转为目标分词代码后,将目标分词代码按所述目标向量序列中向量的顺序进行组合,得到目标代码。
上述方案,通过确定表征输入代码特征的上下文向量,基于该上下文向量对分词代码的分词向量纠错,精准地确定出规范的代码所对应的目标向量序列;进而将该目标向量序列中的向量转化为代码形式,即可得到规范的目标代码。通过方式不仅不需要手动配置规则,而且能较为全面地对各种代码进行纠错。
一些可选的实施方式中,基于所有分词代码的分词向量,确定各分词代码的隐藏信息,包括:
基于第一预设隐藏信息以及第一分词代码的分词向量,确定第一分词代码的隐藏信息;其中,所述第一分词代码为基于分词代码在所述输入代码中的顺序确定的第一个分词代码;以及
针对除所述第一分词代码之外的任一其他分词代码,基于所述其他分词代码的分词向量以及上一分词代码的隐藏信息,确定所述其他分词代码的隐藏信息;其中,所述上一分词代码为基于分词代码在所述输入代码中的顺序确定的所述其他分词代码的上一个分词代码。
一些可选的实施方式中,基于所述输入代码的各级上下文向量,从预设的可选向量中选择目标向量序列,包括:
基于第二预设隐藏信息,所述各级上下文向量以及预设起始符,从可选向量中选择各级目标向量;
基于各级目标向量确定目标向量序列。
上述方案,基于第二预设隐藏信息,各级上下文向量以及预设起始符,可以精准地从可选向量中选择出各级目标向量;进而基于各级目标向量精准地确定出目标向量序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210208542.2/2.html,转载请声明来源钻瓜专利网。





