[发明专利]违法网站识别方法、装置、电子装置和存储介质在审
申请号: | 202110986619.4 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113779389A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 汪斌;范渊;黄进 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958;H04L29/12 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 聂磊 |
地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 违法 网站 识别 方法 装置 电子 存储 介质 | ||
本申请涉及一种违法网站识别方法、装置、电子装置和存储介质,其中,该违法网站识别方法包括:获取违法域名集和合法域名集,其中,所述违法域名集包括多个违法域名,所述合法域名集包括多个合法域名;根据所述违法域名集和所述合法域名集,获取违法域名信息集和合法域名信息集;根据所述违法域名信息集和合法域名信息集进行匹配,生成域名关联集;根据所述域名关联集,建立违法域名树。通过本申请,解决了无法即时准确的识别违法网站的问题,实现了加快基于关联域名的违法域名信息的搜索速度和提高基于关联域名的违法域名信息搜索的准确性、扩充搜索范围等,可用于高效地、准确地、大规模地识别违法网站。
技术领域
本申请涉及互联网信息安全领域,特别是涉及违法网站识别方法、装置、电子装置和存储介质。
背景技术
随着近年来互联网产业的飞速发展,互联网的服务模式和传播渠道也日趋多样化。新闻网站、门户网站、搜索引擎、论坛、博客、P2P等多种服务模式并存,互联网已演化成为一个虚拟社会,互联网安全管理面临空前的挑战。
互联网信息技术的不断进步,不仅给互联网用户提供便利,也使计算机信息领域的犯罪越来越多,对国家和个人造成了越来越大的影响。如何高效、准确识别违法网站已成为一个至关重要的关键点。
目前,政府部门或第三方厂商往往会设置相应的举报途径,接收来自互联网用户的举报信息,对举报信息进行核实,再对违法网站、违禁内容进行查封,以实现对互联网内容的监督。但是,大多数互联网用户缺乏一定的鉴别能力,往往只有在上当受骗后,才能进行举报,甚至在不知情的情况下,根本不会进行举报。
然而,在大量的网站面前如果通过人工进行审核,很难在短时间内通过人工识别出违法网站。因此,在人力有限的情况下,利用先进的计算机信息安全技术对网站进行准确的识别已成为亟待解决的问题。
针对相关技术中存在无法即时准确的识别违法网站,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种违法网站识别方法、装置、电子装置和存储介质,以解决相关技术中存在无法即时准确的识别违法网站的问题。
第一个方面,在本实施例中提供了一种违法网站识别方法,包括:
获取违法域名集和合法域名集,其中,所述违法域名集包括多个违法域名,所述合法域名集包括多个合法域名;
根据所述违法域名集和所述合法域名集,获取违法域名信息集和合法域名信息集;
根据所述违法域名信息集和合法域名信息集进行匹配,生成域名关联集;
根据所述域名关联集,建立违法域名树。
在其中的一些实施例中,所述根据所述合法域名信息集和违法域名信息集,生成域名关联集包括:
其中,所述违法域名信息集包括多个违法域名信息,所述合法域名信息集包括多个合法域名信息;
将所述违法域名信息和多个所述合法域名信息进行广度优先搜索,获得关联路径;
根据所述关联路径,生成域名关联集。
在其中的一些实施例中,所述将所述违法域名信息和多个所述合法域名信息进行广度优先搜索,获得关联路径包括:
将所述违法域名信息集内的违法域名信息逐一与所述合法域名信息集内的合法域名信息进行匹配,获得对应的关联域名;
根据多个所述关联域名,生成关联路径。
在其中的一些实施例中,所述将所述违法域名信息集内的违法域名信息逐一与所述合法域名信息集内的合法域名信息进行匹配,获得对应的关联域名包括:
检测所述违法域名信息与所述合法域名信息的相似度是否大于关联阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110986619.4/2.html,转载请声明来源钻瓜专利网。