[发明专利]一种基于大数据与机器学习的虚拟机安全防护方法及系统有效
| 申请号: | 201810985819.6 | 申请日: | 2018-08-27 |
| 公开(公告)号: | CN109254827B | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 代琪怡;李松林;李平阳;谢开林;章志辉;廖西;颜琪;李茂毅;蔡波 | 申请(专利权)人: | 电子科技大学成都学院 |
| 主分类号: | G06F9/455 | 分类号: | G06F9/455;G06F21/56 |
| 代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 马林中 |
| 地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 机器 学习 虚拟机 安全 防护 方法 系统 | ||
1.一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:包括以下步骤:
步骤1:从虚拟机的虚拟磁盘内提取NTFS文件系统里面的普通文件和浏览器文件;
步骤2:识别普通文件中的恶意特征,将识别的恶意特征与恶意文件特征库中的特征进行比对,判断该文件是否为恶意文件,若为恶意文件则进行清理并跳转至步骤3,否则直接跳转至步骤3;
步骤3:提取所述浏览器文件中的网址,利用构建的机器学习模型判断所述网址是否为恶意网址,若为恶意网址,则清理所述恶意网址并结束流程,否则直接结束流程;
所述步骤3中,判断网址是否为恶意网址的具体步骤如下:
步骤31:利用爬虫技术收集大量网站信息,并对网站的网址进行拆分,将拆分后的网址作为训练样本;
步骤32:利用拆分后的网址形成网址线性表,对所述网址线性表采用tf-idf算法进行加权处理,得到网址中各个分词的权重,形成权重线性表;
步骤33:构建机器学习模型,对所述训练样本的权重线性表,采用逻辑回归算法,进行机器学习训练,得到训练后的机器学习模型;
步骤34:将待识别网址进行与步骤31相同的拆分处理和与步骤32中相同的加权处理,得到待识别网址的权重线性表,将待识别网址的权重线性表输入训练后的机器学习模型,得出识别结果。
2.根据权利要求1所述的一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:所述步骤1中,NTFS文件系统里的普通文件包括exe文件和office文件。
3.根据权利要求2所述的一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:所述步骤1中,NTFS文件系统里的普通文件和浏览器文件的获取步骤如下:
步骤11:获取所述虚拟机的虚拟磁盘句柄并初始化所述磁盘句柄;
步骤12:利用所述磁盘句柄获取所述NTFS文件系统里的起始扇区并获得所述NTFS文件系统里的MTF文件记录表;
步骤13:遍历所述MTF文件记录表中的文件记录号;
步骤14:利用所述文件记录号进行普通文件和浏览器文件的提取。
4.根据权利要求3所述的一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:所述步骤14中,NTFS文件系统里的普通文件获取方法为:读取所述文件记录号下文件的H30属性值,利用所述H30属性值判断普通文件的类型,若文件为小型文件,则在该文件的H80属性中提取文件数据;若文件为大型文件,则在该文件的H80属性中提取该文件的数据流地址,利用所述数据流地址提取文件数据。
5.根据权利要求3所述的一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:所述步骤14中,浏览器文件的获取步骤为:
步骤141:读取所述文件记录号下浏览器文件的H30属性,利用所述H30属性判断该文件记录号下文件路径是否与浏览器对应的路径匹配,若匹配,则跳转至步骤142,否则跳转至步骤13;
步骤142:判断是否取出当前文件记录号下的所有浏览器文件,若是,则跳转至步骤143,否则根据浏览器文件的H80属性找到浏览器文件数据并提取;
步骤143:判断该浏览器文件的属性,若为HA0属性,则提取HA0属性地址,并利用HA0属性地址找到浏览器文件数据并提取;若为H90属性,则遍历H90属性中的H90索引,利用所述H90索引找到浏览器文件数据并提取。
6.根据权利要求2所述的一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:所述普通文件中还包括注册表文件,所述注册表文件中键值信息用于辅助恶意文件的判断。
7.根据权利要求1所述的一种基于大数据与机器学习的虚拟机安全防护方法,其特征在于:所述步骤2中所述恶意特征包括:
病毒的MD5、SHA1、SHA256独有签名;或
文件反汇编后的代码段特征;或
文件的api流程图的特征;或
Api出现的频率的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学成都学院,未经电子科技大学成都学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810985819.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:虚拟化加速处理装置的挂起检测
- 下一篇:JVM安全退出的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





