[发明专利]一种仿冒网站监测识别方法及系统在审
申请号: | 201710145302.1 | 申请日: | 2017-03-13 |
公开(公告)号: | CN107181730A | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | 王海洋;李雪梅;杜慧;刘衍琦;刘玮;程学旗 | 申请(专利权)人: | 烟台中科网络技术研究所;中国科学院计算技术研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 杨立,王博 |
地址: | 264003 山东省烟台*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种仿冒网站监测识别方法及系统,方法包括S1、分别对被仿冒网站和待检测网站进行页面解析,得到解析后的被仿冒网页和待检测网页;S2、分别对解析后的被仿冒网页和待检测网页进行特征提取,得到被仿冒网页和待检测网页的网页特征;S3、计算被仿冒网页与待检测网页的网页特征的相似性,得到对应于网页特征中所有特征的所有计算结果;S4、对所有计算结果进行集成汇总,得到集成汇总结果;S5、将集成汇总结果与预设阈值进行比较,如果集成汇总结果大于预设阈值,则待检测网站为仿冒网站。本发明的有益效果是同时考虑了网页URL、网页内容以及网页图像的相似性,并对三个相似性进行集成汇总,提高对仿冒网站进行识别的准确性。 | ||
搜索关键词: | 一种 仿冒 网站 监测 识别 方法 系统 | ||
【主权项】:
一种仿冒网站监测识别方法,其特征在于,包括:S1、分别对被仿冒网站和待检测网站进行页面解析,得到解析后的被仿冒网页和待检测网页;S2、分别对解析后的所述被仿冒网页和所述待检测网页进行特征提取,得到所述被仿冒网页的网页特征和所述待检测网页的网页特征,其中,所述网页特征包括:网页URL、网页内容和网页截图;S3、计算所述被仿冒网页的网页特征与所述待检测网页的网页特征的相似性,得到对应于所述网页特征中所有特征的所有计算结果;S4、对所有所述计算结果进行集成汇总,得到集成汇总结果;S5、将所述集成汇总结果与预设阈值进行比较,如果所述集成汇总结果大于所述预设阈值,则所述待检测网站为仿冒网站。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台中科网络技术研究所;中国科学院计算技术研究所,未经烟台中科网络技术研究所;中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710145302.1/,转载请声明来源钻瓜专利网。