[发明专利]一种带有初次筛选功能的数据过滤挖掘方法在审
| 申请号: | 201910160208.2 | 申请日: | 2019-03-04 |
| 公开(公告)号: | CN109902243A | 公开(公告)日: | 2019-06-18 |
| 发明(设计)人: | 倪向东;柯金霞 | 申请(专利权)人: | 广州博士信息技术研究院有限公司 |
| 主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/957;G06F16/332 |
| 代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
| 地址: | 510000 广东省广州市广州高*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征码 用户访问 字词数据库 网页数据 敏感 敏感数据 数据过滤 过滤 判定 数据安全技术 用户访问网页 筛选 绿色上网 色情网站 上网行为 实时监控 数据特征 挖掘 阈值时 打码 | ||
1.一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:包括以下步骤:
步骤一:从字词数据库中计算敏感字词数据库特征码,并建立敏感字词数据库特征码;
步骤二:监控用户访问网页的行为,当监控到用户访问网页时的行为后,按照步骤一所述的计算用户访问网页数据的特征码的方法,计算出该用户访问网页时的数据特征码;
步骤三:将用户访问的网页数据特征码与敏感字词数据库特征码进行对比,并获取用户访问网页数据特征码与敏感字词数据库特征码相同的特征码的数量,并将与敏感字词相同的数据特征码进行存储;
步骤四:当步骤三中获取与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量达到设定的阈值时,可以判定所述用户访问的数据为敏感数据;当与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量未达到系统设定的阈值时,重复步骤二到四,直到用户访问网页的行为结束为止;
步骤五:当判定所述用户访问的网页数据特征码是敏感数据时,则将所述用户访问的网页数据特征码内的敏感字词进行过滤并打码。
2.根据权利要求1所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述步骤五将敏感字词进行打码过滤的同时还提醒用户关闭网页,若10s之内不关闭的话,系统将自动强制关闭网页。
3.根据权利要求2所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述提醒用户关闭网页的信息为警告词汇,并采用提示框的方式。
4.根据权利要求1所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述步骤五打码的形式为***。
5.根据权利要求1所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述步骤五中强制关闭网页次数达到三次以上后,系统将自动锁闭网页,并以邮件的方式再次警告访问用户,且邮件内有绿色上网学习问答的网址。
6.根据权利要求5所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述用户若想再次解开网页,则需要点击绿色上网学习问答的网址学习并进行答题,若答题成功,则解除网页的锁定。
7.根据权利要求1所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述步骤一中所述敏感字词数据库据特征码,具体为计算敏感字词数据库的MD5值。
8.根据权利要求1所述的一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:所述步骤三将与敏感字词相同的数据特征码存储在后台系统的数据库内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博士信息技术研究院有限公司,未经广州博士信息技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910160208.2/1.html,转载请声明来源钻瓜专利网。





