[发明专利]文本内容审核方法及装置有效
| 申请号: | 201910904584.8 | 申请日: | 2019-09-24 |
| 公开(公告)号: | CN110674255B | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 吴红;张亦驰;向钊豫;欧阳潘义 | 申请(专利权)人: | 湖南快乐阳光互动娱乐传媒有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
| 地址: | 410003 湖南省*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 内容 审核 方法 装置 | ||
本发明提供了一种文本内容审核方法,包括:当接收到文本审核请求时,获取文本内容,并将文本内容的各个词数据与数据库中的各个关键词数据进行匹配。若存在词数据匹配成功,则确定该文本内容为负面文本,并生成第一审核结果发送给客户端;若不存在词数据匹配成功,则将该文本内容输入AI审核模型中进行审核,获取AI审核模型输出的审核参数,并依据该审核参数生成第二审核结果发送给客户端,该审核参数用于确定该文本内容是否为负面文本。应用该方法,在利用数据库中各个关键词数据进行匹配的基础上,再通过AI审核模型进行深度的审核,提高对文本内容审核的精度,正确地获知该文本内容是否为负面文本。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种文本内容审核方法及装置。
背景技术
随着互联网的发展以及网络用户的增多,人们越来越依赖于互联网,并进行各种信息的传播,例如新闻评论、视频弹幕、论坛、微博、博客等。用户可以在各个网络平台上发表言论。但是,随着网络上言论的增多,总有些不文明用户会在网上散播一些带有辱骂的负面性评论内容,或发布一些没有任何参考、阅读价值的灌水文本内容,会导致其他用户跟风散播负面内容的言论,影响网络环境。
在现有技术中,各大网络媒体运行商都会对用户发表的各种文本内容进行审核,通常做法是通过匹配关键词的方式,判断用户发表的文本内容中是否为负面文本或灌水文本。但是仅根据匹配关键词不一定能够完全识别出文本内容中携带的负面词汇,不文明用户在发表言论时,会将文本内容中负面词组替换成同音的词组,例如:微信、威信、薇信;或利用一些特殊符号将同一个词组的多个单词分开,使得审核文本内容过程中无法正确的判定该文本内容是否携带有负面词汇。
发明内容
有鉴于此,本发明提供了一种文本内容审核方法,先将文本内容的各个词数据与数据库中的各个关键词数据进行匹配,以确定文本内容是否存在负面的单词或词组。若各个词数据均未成功匹配,再利用AI审核模型对文本内容进行深度的审核,提高对文本内容审核的精度,正确地获知该文本内容是否为负面文本。
本发明还提供了一种文本内容审核装置,用以保证上述方法在实际中的实现及应用。
一种文本内容审核方法,包括:
当接收到客户端发送的文本审核请求时,获取所述文本审核请求中包含的文本内容;
确定与所述文本内容对应的各个词数据,并将每个所述词数据与预先建立的数据库中的各个关键词数据进行匹配,所述各个词数据包括所述文本内容中的单词、词组以及每个所述单词对应的单词拼音和每个所述词组对应的词组拼音,所述关键词数据为预先设定的各个关键词及每个关键词对应的关键词拼音;
当存在词数据与所述数据库中的关键词数据相匹配时,确定所述文本内容为负面文本,并生成与所述负面文本对应的第一审核结果,将所述第一审核结果发送至所述客户端;
当不存在词数据与所述数据库中的关键词数据相匹配时,将所述文本内容输入预先训练完成的AI审核模型中,触发所述AI审核模型对所述文本内容进行审核;
当接收到所述AI审核模型依据所述文本内容输出的审核参数时,依据所述审核参数生成第二审核结果,并将所述第二审核结果发送至所述客户端,所述审核参数包括正常文本的审核参数、负面文本的审核参数及灌水文本的审核参数。
上述的方法,可选的,所述确定与所述文本内容对应的各个词数据,并将每个所述词数据与预先建立的数据库中的各个关键词数据进行匹配,包括:
调用预先设置的分词模块从所述文本内容提取多个单词及词组;
确定每个所述单词对应的词拼音,及每个所述词组对应的词组拼音;
将各个所述单词、词组分别与所述数据库中过的各个关键词进行匹配,并将各个所述单词对应的单词拼音及各个所述词组对应的词组拼音分别与所述数据库中的关键词拼音进行匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910904584.8/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





