[发明专利]基于自设敏感词的网页敏感文本处理方法及系统在审

专利信息
申请号: 202010846399.0 申请日: 2020-08-21
公开(公告)号: CN111966906A 公开(公告)日: 2020-11-20
发明(设计)人: 徐昌梅;杨盘云 申请(专利权)人: 绍兴市寅川软件开发有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/335
代理公司: 绍兴市寅越专利代理事务所(普通合伙) 33285 代理人: 胡国平
地址: 312000 浙江省绍兴市柯*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 敏感 网页 文本 处理 方法 系统
【权利要求书】:

1.一种基于自设敏感词的网页敏感文本处理方法,其特征在于,所述方法包括如下步骤:

接收到用户终端发送的敏感词设置请求,获取用户的ID;

根据用户的ID获取用户历史操作数据,根据用户历史操作数据为用户推荐敏感词,将推荐的敏感词发送至所述用户终端;

接收所述用户终端选择的敏感词,设定为用户自设敏感词;

接收到所述用户终端的网页获取请求时,对获取的网页采用所述用户自设敏感词和默认敏感词进行处理,将所述网页中的敏感词去除或采用预设符号代替;

将处理后的网页发送至所述用户终端。

2.根据权利要求1所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,所述对获取的网页采用所述用户自设敏感词和默认敏感词进行处理,包括如下步骤:

对所有网页采用所述默认敏感词进行处理;

根据用户的ID获取用户自设敏感词;

对所述用户终端请求获取的网页采用所述用户自设敏感词进行处理。

3.根据权利要求2所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,所述默认敏感词包括全局默认敏感词和各个用户类别的类别默认敏感词;

所述对所有网页采用所述默认敏感词进行处理,包括如下步骤:

对所有网站采用所述全局默认敏感词进行处理;

根据用户的ID获取用户特征数据,将所述用户特征数据输入训练好的用户分类模型,得到用户的类别;

查找所述用户的类别所对应的类别默认敏感词;

对所述用户终端请求获取的网页采用所述类别默认敏感词进行处理。

4.根据权利要求3所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,所述方法还包括采用如下步骤设定各个用户类别所对应的类别默认敏感词:

获取所述用户类别所对应的多个用户的用户自设敏感词;

统计所述多个用户的用户自设敏感词中每个敏感词的出现次数;

选择出现次数大于预设出现次数阈值的敏感词,作为该用户类别的类别默认敏感词。

5.根据权利要求4所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,所述选择出现次数大于预设出现次数阈值的敏感词,作为该用户类别的类别默认敏感词,包括如下步骤:

选择出现次数大于预设次数阈值的敏感词,作为候选类别默认敏感词;

对于每个候选类别默认敏感词,获取将该候选类别默认敏感词作为用户自设敏感词的用户的地理位置;

计算该候选类别默认敏感词的用户的地理位置的集中度,判断所述集中度是否小于预设集中度阈值,所述集中度越大,表明该候选类别默认敏感词的用户的地理位置越集中;

如果所述集中度小于预设集中度阈值,则将该候选类别默认敏感词加入类别默认敏感词。

6.根据权利要求5所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,所述计算该候选类别默认敏感词的用户的地理位置的集中度,包括如下步骤:

根据该候选类别默认敏感词的用户的地理位置在地图上绘制多个位置节点;

从所述多个位置节点中选择最外侧的一个位置节点作为基准节点;

分别计算其他未作为基准节点的各个位置节点与基准节点的距离的平均值,计算所述距离的倒数,作为该候选类别默认敏感词的用户的地理位置的集中度。

7.根据权利要求1所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,所述根据用户的ID获取用户历史操作数据,根据用户历史操作数据为用户推荐敏感词,包括如下步骤:

从用户历史操作数据中获取用户的主动屏蔽操作;

获取用户的主动屏蔽操作所对应的主动敏感词,将所述主动敏感词作为推荐的敏感词;

根据所述主动敏感词查找所述主动敏感词的相似敏感词,将所述相似敏感词作为推荐的敏感词。

8.根据权利要求1所述的基于自设敏感词的网页敏感文本处理方法,其特征在于,接收所述用户终端选择的敏感词,包括接收所述用户终端对推荐的敏感词的选择以及用户通过用户终端输入的敏感词,作为所述用户终端选择的敏感词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绍兴市寅川软件开发有限公司,未经绍兴市寅川软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010846399.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top