[发明专利]一种基于私有云平台的代码组成分析系统和方法有效
申请号: | 201711380812.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN107977575B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 焦相辰;余徐勇;白静 | 申请(专利权)人: | 北京关键科技股份有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 私有 平台 代码 组成 分析 系统 方法 | ||
1.一种基于私有云平台的代码组成分析系统,其特征在于,包括项目管理子系统、代码分析子系统、代码评估子系统、代码收集子系统和代码知识库子系统;
所述的代码收集子系统利用网络爬虫技术获取互联网代码和安全漏洞信息,提供持续在线、站点轮询和代码文件自动过滤的技术能力,实现对网络开源二进制代码和安全漏洞信息的高效抓取,实现代码和安全信息的持续、全面、自动的收集和存储;
所述的代码收集子系统应用的关键技术包括:基于代码主题的互联网爬虫技术和知识库增量管理与冗余备份方法;
所述的代码知识库子系统利用互联网收集到的代码和安全漏洞数据建立代码知识库,存储处理过后的代码多级特征,按危害等级管理安全漏洞,提供代码文件、代码多级特征、安全漏洞之间的数据关联能力,形成代码的大数据资源,构建代码知识图谱;
所述的代码知识库子系统应用的关键技术包括:基于分级特征的知识图谱构建方法和软件代码安全风险知识管理技术;
所述的代码分析子系统应用的关键技术包括:基于关键字的开源代码分析技术、混源代码多级特征分析与检测技术、变尺度滚动哈希二进制代码分析技术和基于反汇编的代码多级特征分析技术;
所述的代码评估子系统负责对代码分析结果的量化评估和可视化展示,利用代码分析结果构建评估体系,根据选择度量元、获取评价指标、建立评估要素之间的相互关系,实现代码组成量化评估、许可证合规性评估、代码风险评估和代码自主化评估能力,并将上述量化评估结果以用户易理解的形式进行可视化展示;
所述的代码评估子系统应用的关键技术包括:代码组成量化评估、代码许可证合规性评估、代码安全风险评估和软件代码自主化评估;
所述的项目管理子系统根据代码分析组成任务管理需求,实现对用户进行角色密码管理、用户群组权限控制、代码版本和信息描述、源文件和特征分类存储、代码分析结果关联检索的能力。
2.一种基于私有云平台的代码组成分析方法,其特征在于,包括代码知识库在线收集与知识图谱构建方法、混源代码智能检测与分析的方法、基于私有云平台的计算多任务并行高速处理方法、混源代码组成量化分析评估方法;基于私有云计算的多任务并行高速处理平台,采用自动化的网络 收集技术,通过在线收集构建代码知识库与知识图谱,使用代码混源技术,先识别混源代码 的组成,再与代码安全漏洞关联,实现对代码 安全的量化评估,构建混源代码组成量化分析评估体系;
所述 的代码知识库在线收集与知识图谱构建方法,基于代码主题的互联网爬虫技术是根据特定 的主题,在网络上访问与主题相关的链接,进而获取与特定主题相关的信息;主题爬虫根据 一定的主题有针对性地在网络上获取信息,分析网页的主题内容,过滤掉与主题无关的链 接,保留与主题相关的链接;
所述 的混源代码智能检测与分析的方法,使用属性计数法提取特征值时只对代码的一些统计属 性进行处理,而不考虑代码的内部结构; 其中,词频统计法源于信息检索技术中的向量空间模型;首先要统计每个代码段中各个词法元素出现的频率,并构成特征向量,最后采用向量空间 模型的点积或者余弦公式来度量两个代码段的相似性;该方法就是对开源代码中的词元进 行词频统计,n1为操作符的种类数,n2为操作数的种类数,N1为所有操作符总数,N2为所有操 作数总数,并由此计算出:
词汇量:n=n1+n2,长度:N=N1+N2,容量:V=Nlog2(n),然后可用Halstead特征向量:H(n,N,V)来标志一段代码;
所 述的基于私有云平台的计算多任务并行高速处理方法,调度算法就是根据用户提交的任务 需求以及任务对资源的信任效益值需求,采用适当的策略将用户任务集合T={t1,t2,..., tn}中n个相互独立的任务分配到虚拟化的资源池M={m1,m2,...,mm}中m个可用资源上;在 私有云计算环境中,m个资源和n个任务求映射方案map=(a,s);其中a:T→M表示资源分配 的映射,a(i)=j表示将ti分配到mj上;s:{(i,a(i))|i∈T}→N={1,2,...,n}表示在资源上 的任务调度函数,s(i,j)=k表示在计算资源mj上第k个执行的任务是ti,在满足最大信任效 益值Maximize TrustUtilmap的情况下,进行多资源选择,利用最短完成时间MCT调节资 源负载,从而使得任务执行时间跨度最短,即Minimizemakespanmap。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京关键科技股份有限公司,未经北京关键科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711380812.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:病毒识别方法和装置
- 下一篇:一种基于应用指纹的主机漏洞检测系统及方法