[发明专利]一种网站的监控方法及装置有效
申请号: | 201611153696.7 | 申请日: | 2016-12-14 |
公开(公告)号: | CN108234392B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 曹志明 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F16/958;G06F16/903 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网站 监控 方法 装置 | ||
本发明公开了一种网站的监控方法及装置,涉及计算机技术领域,主要目的是提高网站监控的效率。所述方法包括:获取网站关键词数据;将所述网站关键词数据与预置非法关键词词库中的关键词进行匹配,得到匹配结果相一致的网站关键词,所述预置非法关键词词库中记录有不同领域的涉及非法内容的关键词;查询所述匹配结果相一致的网站关键词对应的着陆页,根据所述着陆页的内容对网站进行监控。本发明主要用于监控网站是否为非法网站。
技术领域
本发明涉及计算机技术领域,尤其是一种网站的监控方法及装置。
背景技术
互联网安全问题日益严峻,部分网站中有时会出现色情、赌博等违反国家法律规定的敏感内容,有时会出现非法产品推广内容,以及对网站管理人员不友好的敏感内容,此时需要第一时间通知管理人员对网站进行监控,并删除相关敏感内容。
对于上述敏感内容的出现通常有以下两种情况,一种是该网站被非法分子入侵,非法分子通过网页挂马的形式篡改了网页原始内容;另一种是某些网民在网站上,通常是论坛型网站上提交了非法内容。
目前,针对上述两种情况的敏感内容有不同的网站监控方法,对于网页挂马形式的敏感内容通常采用哈希算法生成校验码的方式来实现网站监控,具体为:当网页文件内容发生改变时校验码也会随之改变,进而通过比对不同时间的校验码来判断网站内容是否发生更改,若对比不同时间的校验码不同则说明网站内容发生了改变,需要网站管理人员进一步检测来判断该内容是否为非法关键词,进而实现网站的监控,然而哈希算法只能用于监控网站的静态内容,无法监控网站的动态内容,使得网站监控有一定的局限性;对于网民在网站上提交的非法数据通常需要人工监控网站的内容,或者需要网民举报来判断该内容是否为非法关键词,进而实现网站的监控,然而该网站监控方法需要耗费大量的人力和时间,导致网站监控的效率较低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种网站的监控方法及装置,能够提高网站监控的效率。
一方面,本发明提供了一种网站的监控方法,包括:
获取网站关键词数据;
将所述网站关键词数据与预置非法关键词词库进行匹配,得到匹配结果相一致的网站关键词,所述预置非法关键词词库中记录有不同领域的涉及非法内容的关键词;
查询所述匹配结果相一致的网站关键词对应的着陆页,根据所述着陆页的内容对网站进行监控。
进一步地,所述获取网站关键词数据包括:
通过在网站内部署网站监测工具,根据网站监测工具监测到所述网站关键词数据;或
通过在网站内部署采集网站关键词数据的脚本,根据所述脚本获取网站关键词数据。
进一步地,在所述将所述网站关键词数据与预置非法关键词词库中的关键词进行匹配之前,所述方法还包括:
获取非法关键词;
根据所述非法关键词涉及的不同领域对所述非法关键词进行划分,得到不同领域的非法关键词;
根据所述不同领域的非法关键词建立非法关键词词库。
进一步地,所述查询所述匹配结果相一致的网站关键词对应的着陆页,根据所述着陆页的内容对网站进行监控包括:
通过网站监测工具中保存的数据库查询所述匹配结果相一致的网站关键词对应的着陆页,所述数据库中记录有各个网站关键词与该关键词对应的着陆页之间的映射关系;
根据所述着陆页的内容判断所述着陆页对应的网站是否为非法网站。
进一步地,所述方法还包括:
根据所述着陆页中包含非法关键词涉及的不同领域统计出不同领域非法关键词的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611153696.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种登录信息提示方法及装置
- 下一篇:优化数据链路层报文的方法及装置