[发明专利]一种带有初次筛选功能的数据过滤挖掘方法在审
| 申请号: | 201910160208.2 | 申请日: | 2019-03-04 |
| 公开(公告)号: | CN109902243A | 公开(公告)日: | 2019-06-18 |
| 发明(设计)人: | 倪向东;柯金霞 | 申请(专利权)人: | 广州博士信息技术研究院有限公司 |
| 主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/957;G06F16/332 |
| 代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
| 地址: | 510000 广东省广州市广州高*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种带有初次筛选功能的数据过滤挖掘方法,涉及数据安全技术领域,其包括以下步骤:先建立敏感字词数据库特征码;然后计算出该用户访问网页时的数据特征码;然后将用户访问的网页数据特征码与敏感字词数据库特征码进行对比,然后当步骤三中获取与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量达到设定的阈值时,可以判定所述用户访问的数据为敏感数据;最后当判定所述用户访问的网页数据特征码是敏感数据时,则将所述用户访问的网页数据特征码内的敏感字词进行过滤并打码。本发明通过建立敏感字词数据库特征码,并对用户的上网行为进行实时监控,解决了色情网站无法过滤的缺陷,达到绿色上网的目的。 | ||
| 搜索关键词: | 特征码 用户访问 字词数据库 网页数据 敏感 敏感数据 数据过滤 过滤 判定 数据安全技术 用户访问网页 筛选 绿色上网 色情网站 上网行为 实时监控 数据特征 挖掘 阈值时 打码 | ||
【主权项】:
1.一种带有初次筛选功能的数据过滤挖掘方法,其特征在于:包括以下步骤:步骤一:从字词数据库中计算敏感字词数据库特征码,并建立敏感字词数据库特征码;步骤二:监控用户访问网页的行为,当监控到用户访问网页时的行为后,按照步骤一所述的计算用户访问网页数据的特征码的方法,计算出该用户访问网页时的数据特征码;步骤三:将用户访问的网页数据特征码与敏感字词数据库特征码进行对比,并获取用户访问网页数据特征码与敏感字词数据库特征码相同的特征码的数量,并将与敏感字词相同的数据特征码进行存储;步骤四:当步骤三中获取与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量达到设定的阈值时,可以判定所述用户访问的数据为敏感数据;当与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量未达到系统设定的阈值时,重复步骤二到四,直到用户访问网页的行为结束为止;步骤五:当判定所述用户访问的网页数据特征码是敏感数据时,则将所述用户访问的网页数据特征码内的敏感字词进行过滤并打码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博士信息技术研究院有限公司,未经广州博士信息技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910160208.2/,转载请声明来源钻瓜专利网。





