[发明专利]一种基于特征融合的算法血缘管理方法及装置在审
申请号: | 202210871381.5 | 申请日: | 2022-07-22 |
公开(公告)号: | CN115373738A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 潘晓华;王楦烨;苏蒙蒙;沈诗婧;尹建伟 | 申请(专利权)人: | 浙江大学滨江研究院 |
主分类号: | G06F8/75 | 分类号: | G06F8/75;G06F16/33;G06F16/338 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 高燕 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 融合 算法 血缘 管理 方法 装置 | ||
本发明公开了一种基于特征融合的算法血缘管理方法,包括:步骤1、获取算法信息与对应的源码数据,对所述源码数据进行解析,获得控制流图与控制流图中节点信息对应的抽象语法树;步骤2、获取源码数据在控制流图中对应的节点信息,计算获得节点嵌入向量;步骤3、获取源码数据在抽象语法树中对应的序列标识符,计算获得词嵌入向量;步骤4、对节点嵌入向量和词嵌入向量进行融合,获得对应的融合特征向量;步骤5、根据算法信息和融合特征向量,对融合特征向量进行可视化分析,获得算法血缘图谱。本发明还提供了一种算法血缘管理装置。本发明提供的方法通过融合算法的多维特征,从而解决算法来源难以追溯,难以管理的问题。
技术领域
本发明涉及数据管理技术领域,尤其涉及一种基于特征融合的算法血缘管理方法及装置。
背景技术
近年来,随着软件领域的迅猛发展,越来越多的应用系统、网站等被人类通过网络连接、访问,软件供应链越发复杂多元,复杂的软件供应链会引入一系列的安全问题,如算法孤岛现象严重、算法来源难追溯、算法质量难保障等,软件系统的质量成为国内外的研究焦点,代码安全逐渐成为学术界、工业界的热门话题。
为了方便对算法进行溯源分析及管理,需要将算法血缘关系进行可视化,从而将算法血缘关系清晰地呈现在用户面前。然而,现有的可视化分析方法中,基于词法的表示方法实现简单快捷,但是忽略了算法的结构特性;基于语法的表示方法虽然解决了词法的缺陷,但是忽略了算法的上下文之间的依赖,基于语义的表示方法虽然解决了基于语法的缺陷,可以方便了解程序的执行过程,但是最终模型的复杂程度巨大。
专利文献CN112783857A公开了一种数据血缘管理方法、装置、电子设备及存储介质。其方法包括:获取目标元数据的工作流,并将工作流存储至目标节点;工作流包括至少一个流程组件;对工作流中的流程组件进行解析,确定各个流程组件的来源表、目标表以及来源表中来源字段和目标表中目标字段之间的关联关系;通过目标节点的属性信息和分枝图对数据血缘进行管理。该方法针对数据的全流程,即从数据产生到数据消亡的记录和管理,需要实时进行更新数据流内容。
专利文献CN110363985A公开了一种交通数据分析方法、装置、存储介质及设备。该方法包括:获取交通数据;根据血缘管理算法将交通数据进行分类计算,构建包含不同类别交通数据的主题库;根据多维度分析算法对交通数据进行分析计算,构建包含不同维度交通数据的专题库;根据主题库和专题库生成交通数据分析结果。该方法通过血缘管理算法对所以数据进行了分类,并以分类结果进行多维度预测,提高最终决策的整体效益。
传统数据血缘是用于研究数据流向下的表与表之间的关系,在预测过程中针对的是数据与数据之间的作用关系,而本申请提出的算法血缘是针对算法的语法与功能统一管理,但现阶段的算法血缘仅通过语法的表述方式进行呈现,但是对应的源码数据之间的逻辑顺序却不能很好的表达出来,从而影响了后续源码数据管理的难度。
发明内容
为了解决上述问题,本发明提供了一种基于特征融合的算法血缘管理方法,该方法通过融合算法的多维特征,从而解决算法来源难以追溯,难以管理的问题。
一种基于特征融合的算法血缘管理方法,包括:
步骤1、获取算法信息与对应的源码数据,对所述源码数据进行解析,获得控制流图与所述控制流图中节点信息对应的抽象语法树;
步骤2、获取源码数据在所述控制流图中对应的节点信息,计算获得节点信息对应的节点嵌入向量;
步骤3、获得源码数据在所述抽象语法树中对应的序列标识符,计算获得序列标识符对应的词嵌入向量;
步骤4、对步骤2获得的节点嵌入向量和步骤3获得的词嵌入向量进行融合,获得对应源码数据的融合特征向量;
步骤5、根据步骤1获得的算法信息和步骤4获得的融合特征向量,将源码数据对应的融合特征向量进行可视化分析,获得用于溯源管理源码数据的算法血缘图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学滨江研究院,未经浙江大学滨江研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210871381.5/2.html,转载请声明来源钻瓜专利网。