[发明专利]交互过程中智能识别并处理敏感内容的方法及系统在审
申请号: | 201710334441.9 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107169092A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 杜洪博;樊磊;王军;方骏达;汪铁丰 | 申请(专利权)人: | 暴风体育(北京)有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京晟睿智杰知识产权代理事务所(特殊普通合伙)11603 | 代理人: | 于淼 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互 过程 智能 识别 处理 敏感 内容 方法 系统 | ||
技术领域
本发明涉及网络交互管理的技术领域,更具体地,涉及一种交互过程中智能识别并处理敏感内容的方法及系统。
背景技术
随着网络技术的发展,各种社交应用程序(APP)、社交平台的推出,社交聊天逐渐成为了人们常用的信息交互方式,但是社交过程中人员错综复杂,聊天内容也是各种各样,聊天内容多,为保证聊天质量,社交系统需要屏蔽一些不文明或不合法的敏感词汇或发广告(即社交敏感内容,也有的称其为黄版词汇)。
目前,现有技术中通过将聊天词汇与预设的黄版数据库中词汇对比搜索识别是否为黄版词汇,如果发现有黄版词汇,对其使用者的ID进行屏蔽。但是,用户如果采用其它形式词汇替代存在于词库中的黄版词汇,如将“8”替换为“八”的形式,就能绕过屏蔽,不能达到预期的黄版词汇屏蔽的目的。而且网络词汇更新换代如此之快,现有系统对新兴的敏感内容的自动识别能力还不够强,在数据库中也不能智能地、及时地收录这些新兴的敏感词汇内容。
再者,中英文相结合的多个词汇的组合就能得到各种不同的词汇含义,对于如此之多的组合形式,采用现有的敏感词汇库匹配对比查询敏感词汇的方式难道较大且准确性不高,还需要消耗较长的匹配比对时间,执行效率不高,不能够全面地、准确地改变现有敏感词汇的使用和传播。而误操作屏蔽用户之后的申诉过程又很复杂,对用户造成很不好的使用体验。
因此,提供一种智能化、准确度高、操作简便及效率高的交互过程中敏感内容处理方案是本领域亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种交互过程中智能识别并处理敏感内容的方法及系统,解决了现有技术中不能智能化集中处理交互过程中敏感内容的技术问题。
为了解决上述技术问题,本发明提出一种交互过程中智能识别并处理敏感内容的方法,包括:
接收预设敏感内容,按照AC自动机的机制将所述预设敏感内容编译成自动机;将所述自动机按照预设的关键字编码的字符顺序排列,并根据所述字符顺序排列将所述自动机构建成自动机搜索树,并将所述自动机搜索树存储至远程网络请求服务平台上;
接收客户端的交互内容,解析所述交互内容得到交互字符,通过远程服务协议在所述自动机搜索树中逐字读入所述交互字符,通过所述交互字符遍历所述自动机搜索树得到所述交互内容中的敏感内容;
搜索所述客户端的历史交互记录,得到所述敏感内容出现的次数,结合预先设置的敏感内容处理策略,对所述客户端执行相应的处理操作;
基于当前的所述字符顺序排列,根据所述敏感内容更新所述自动机搜索树;
将更新后的所述自动机搜索树及所述敏感内容对应的处理策略存储至所述远程网络请求服务平台上;
统计所述交互字符在交互过程中出现的次数,在所述交互字符在交互过程中出现的次数大于或等于敏感次数时,将所述交互字符反馈至管理端口;
接收所述管理端口的敏感内容指令,并根据所述敏感内容指令将所述交互字符更新至所述自动机搜索树中。
进一步地,其中,所述敏感内容处理策略,为:
所述敏感内容出现次数小于或等于设定次数时,在交互界面中屏蔽该敏感内容,并向所述客户端发送警示消息;
所述敏感内容出现次数大于设定次数且小于或等于设定次数阈值时,在交互界面中屏蔽该敏感内容,并将所述客户端屏蔽预设时间;
所述敏感内容出现次数大于所述设定次数阈值时,在交互界面中屏蔽该敏感内容,并屏蔽所述客户端。
进一步地,其中,所述设定次数,为一到三次;所述设定次数阈值,为三到五次。
进一步地,其中,将所述自动机按照预设的关键字编码的字符顺序排列,并根据所述字符顺序排列将所述自动机构建成自动机搜索树,为:
根据预设的自动机扩展策略获取所述自动机对应的扩展自动机;
将所述自动机及其扩展自动机按照预设的关键字编码的字符顺序排列,并根据所述字符顺序排列将所述自动机构建成自动机搜索树。
另一方面,本发明还提供一种交互过程中智能识别并处理敏感内容的系统,包括:自动机搜索树创建模块、敏感内容获取模块、敏感内容处理模块、自动机搜索树更新模块及敏感内容处理策略存储模块;其中,
所述自动机搜索树创建模块,用于与所述敏感内容获取模块相连接,接收预设敏感内容,按照AC自动机的机制将所述预设敏感内容编译成自动机;将所述自动机按照预设的关键字编码的字符顺序排列,并根据所述字符顺序排列将所述自动机构建成自动机搜索树,并将所述自动机搜索树存储至远程网络请求服务平台上;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暴风体育(北京)有限责任公司,未经暴风体育(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710334441.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据分析方法及装置
- 下一篇:一种目标图像的获取方法及装置