[发明专利]构建评测二进制代码比对工具的测试数据集的方法及系统有效

专利信息
申请号: 202010599618.X 申请日: 2020-06-28
公开(公告)号: CN111813412B 公开(公告)日: 2023-03-24
发明(设计)人: 詹科;陆忠华 申请(专利权)人: 中国科学院计算机网络信息中心
主分类号: G06F8/41 分类号: G06F8/41
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁
地址: 100190 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 构建 评测 二进制 代码 工具 测试数据 方法 系统
【说明书】:

本发明涉及构建评测二进制代码比对工具的测试数据集的方法,包括:从GitHub代码托管服务平台采集多个项目的信息,并存储于数据库系统中;项目的信息包括项目的各发布版本及父版本/子版本对的commit信息;构建分布式编译源代码的环境,以项目各发布版本信息为输入,对项目不同版本的源代码进行编译,获取各版本源代码对应的二进制代码数据样本;依据源代码名称获取对应父版本/子版本对的commit信息,以及遍历存储于数据库中的父版本/子版本对的commit信息,比较父版本/子版本对commit文件的信息,提取差异函数名称;基于获取的二进制代码数据样本及差异函数名称列表,在对应的二进制代码数据样本中提取各差异函数的二进制代码。

技术领域

本发明涉及二进制代码比对工具评测领域,特别涉及构建评测二进制代码比对工具的测试集的方法及系统。

背景技术

对于漏洞挖掘研究人员而言,对二进制代码进行比对是一项重要的工作。不同的二进制代码比对工具提供了不同的功能,二进制代码比对工具可以用于对二进制代码的相似性与差异进行研究。

二进制代码比对方法可以用于系统补丁分析,软件保护等领域。有多种二进制代码比对工具可以用于对二进制代码的相似性与差异进行研究。本专利提出了构建测试集的方法,所构建的测试集用于评测二进制代码比对工具的性能。

发明内容

本发明目的在于,提出构建测试数据集的方法,所构建的测试数据集用于评测二进制代码比对工具的性能。

为实现上述目的,一方面,本发明提供了构建评测二进制代码比对工具的测试数据集的方法,该方法包括以下步骤:

从GitHub代码托管服务平台采集多个项目的信息,并存储于数据库系统中;所述项目的信息包括项目的各发布版本及父版本/子版本对的commit信息,项目版本信息包含当前项目的多个不同版本的源代码;

构建分布式编译源代码的环境,以所述项目各发布版本信息为输入,对项目不同版本的源代码进行编译,获取各版本源代码对应的二进制代码数据样本;

依据源代码名称获取对应父版本/子版本对的commit信息,以及遍历存储于数据库中的父版本/子版本对的commit信息,比较父版本/子版本对commit文件的信息,提取差异函数名称;

基于获取的二进制代码数据样本及差异函数名称列表,在对应的二进制代码数据样本中提取各差异函数的二进制代码。

另一方面,本发明提供了构建评测二进制代码比对工具的测试数据集的系统,该系统包括:

采集单元,用于从GitHub代码托管服务平台采集多个项目的信息,并存储于数据库系统中;所述项目的信息包括项目的各发布版本及父版本/子版本对的commit信息,项目版本信息包含当前项目的多个不同版本的源代码;

编译单元,用于构建分布式编译源代码的环境,以所述项目各发布版本信息为输入,对项目不同版本的源代码进行编译,获取各版本源代码对应的二进制代码数据样本;

解析单元,用于依据源代码名称获取对应父版本/子版本对的commit信息,以及遍历存储于数据库中的父版本/子版本对的commit信息,比较父版本/子版本对commit文件的信息,提取差异函数名称;

提取单元,用于基于获取的二进制代码数据样本及差异函数名称列表,在对应的二进制代码数据样本中提取各差异函数的二进制代码。

本发明在构建的分布式编译环境中对项目不同版本的源代码样本进行分布式编译,以减少样本数据的准备时间;并比较父版本/子版本对commit信息,能够有效提取差异函数名称。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1为本发明实施例提供的构建评测二进制代码比对工具的测试数据集的方法流程示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010599618.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top