[发明专利]低质新闻资源的识别方法及装置、计算机设备及可读介质有效

专利信息
申请号: 201710474726.2 申请日: 2017-06-21
公开(公告)号: CN107463605B 公开(公告)日: 2021-06-11
发明(设计)人: 乔超;黄波;李大任;佘俏俏 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/953 分类号: G06F16/953;G06F16/583;G06F40/289;G06F40/30
代理公司: 北京鸿德海业知识产权代理有限公司 11412 代理人: 袁媛
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 低质 新闻 资源 识别 方法 装置 计算机 设备 可读 介质
【说明书】:

发明提供一种低质新闻资源的识别方法及装置、计算机设备及可读介质。其所述方法包括:获取待识别的新闻资源的信息;根据预先建立的低质新闻信息库与所述待识别的新闻资源的信息,确定所述待识别的新闻资源是否为低质新闻资源。通过采用本发明的技术方案,可以实现通过待识别的新闻资源的信息如文本信息和/或图片,自动识别待识别的新闻资源是否为低质资源,从而大大地缩短低质新闻资源的识别时间,节省审核的人力成本,而且还不会存在审核遗漏,从而能够极大地提高对低质新闻资源的识别效率。

【技术领域】

本发明涉及计算机应用技术领域,尤其涉及一种低质新闻资源的识别方法及装置、计算机设备及可读介质。

【背景技术】

随着移动互联网技术的发展以及移动终端的使用普及,为了更加方便用户通过移动终端能够及时浏览各种最新的新闻资源,市面上逐步涌现出了很多的新闻推荐系统。新闻推荐系统可以根据对用户的自画像,了解用户的兴趣,从而根据用户的兴趣有针对性地向用户推荐的用户感兴趣的文章。但是现有技术中,新闻推荐系统中包括的文章良莠不齐,可能包括一些权威性的高质量的文章,也可能包括一些粗俗、虚假新闻、或者故意吸引用户眼球的、诽谤事实的一些低质量的文章。因此,在新闻推荐系统中,存在对新闻内容质量审核的需求。

现有的新闻推荐系统中,质量较低的新闻资源常有互相抄袭,重复出现的现象,例如一个已经证实为虚假消息的新闻,出于吸引眼球、骗取点击的目的,可能多个不良的新闻作者会对该新闻稍加修改,重复发布。目前,对于这样内容相似的低质新闻资源重复出现的问题,主要通过人工多次审核来解决,效率很低。

但是,现有技术中通过人工审核的方式,识别新闻推荐系统中通过抄袭而重复出现的低质新闻资源,但是,对于每日有大量新增资源的新闻推荐系统来说,人工审核的方式,不仅费时费力,还会存在审核遗漏,导致低质新闻资源的识别效率非常低。

【发明内容】

本发明提供了一种低质新闻资源的识别方法及装置、计算机设备及可读介质,用于提高低质新闻资源的识别效率。

本发明提供一种低质新闻资源的识别方法,所述方法包括:

获取待识别的新闻资源的信息;

根据预先建立的低质新闻信息库与所述待识别的新闻资源的信息,确定所述待识别的新闻资源是否为低质新闻资源。

进一步可选地,如上所述的方法中,若所述待识别的新闻资源仅包括文本信息,获取待识别的新闻资源的信息,具体包括:获取所述待识别的新闻资源的文本信息;

根据预先建立的低质新闻信息库与所述待识别的新闻资源的信息,确定所述待识别的新闻资源是否为低质新闻资源,具体包括:

根据预先建立的低质新闻文本库和所述待识别的新闻资源的文本信息,识别所述待识别的新闻资源的文本信息是否为低质新闻文本;若是,确定所述待识别的新闻资源为低质新闻资源;否则,确定所述待识别的新闻资源为非低质新闻资源;

若所述待识别的新闻资源仅包括图片,获取待识别的新闻资源的信息,具体包括:获取所述待识别的新闻资源的图片;

根据预先建立的低质新闻信息库与所述待识别的新闻资源的信息,确定所述待识别的新闻资源是否为低质新闻资源,具体包括:

根据预先建立的低质新闻图片库和所述待识别的新闻资源的图片,识别所述待识别的新闻资源的图片是否为低质图片;若是,确定所述待识别的新闻资源为低质新闻资源;否则,确定所述待识别的新闻资源为非低质新闻资源;

若所述待识别的新闻资源包括文本信息和图片,获取待识别的新闻资源的信息,具体包括:获取所述待识别的新闻资源的文本信息和图片;

根据预先建立的低质新闻信息库与所述待识别的新闻资源的信息,确定所述待识别的新闻资源是否为低质新闻资源,具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710474726.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top