[发明专利]海量科普资源的可信度验证方法有效

专利信息
申请号: 201911374626.8 申请日: 2019-12-27
公开(公告)号: CN111143653B 公开(公告)日: 2023-06-23
发明(设计)人: 刘小华;胡文心 申请(专利权)人: 上海杰图智能科技有限公司
主分类号: G06F16/951 分类号: G06F16/951;G06F16/215;G06F16/25;G06F16/22;G06F16/9535
代理公司: 上海华诚知识产权代理有限公司 31300 代理人: 徐颖聪
地址: 200333 上海市普陀区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 海量 科普 资源 可信度 验证 方法
【说明书】:

发明涉及数据库及数据分析领域。本发明的方法包括:结合数据爬取技术将现有海量科普数据进行采集、整理、清洗、筛选、分类、融合等方式实现知识构建,针对不同的科普资源搭建不同的资源目录体系,形成资源信息库;根据库中资源的来源、机构、作者的权威性等一系列关键信息以特定的规则针对不同的资源生成该资源的可信程度值;借助不同领域内科普专家的专业力量,搭建专家资源库,并形成对应专家的特征值;再根据规则将分类数据利用协作众包技术匹配对应领域内的科普专家,从而进行打分、评价等方式进行交叉鉴别。本发明可以对海量科普资源实现高可信鉴证,从而能建设汇集公信资源的科普专业资源库。

技术领域

本发明涉及数据库及数据分析领域,特别涉及海量科普资源的可信度鉴证方法。

背景技术

目前,与传统科普模式下的科普内容权威性有余、更新率不足相比,互联网中发布与传播的科普资源具有信息量更大,更新更为迅速,内容更为广泛的特点。社交网络异军突起,蓬勃发展,很快就拥有了巨大的用户量,成为了最重要的新媒体平台之一,海量的用户群生产出海量的信息,这些信息借助社交网络飞速地传播,无论是专业机构、相关企业还是个人,随时都可以在互联网中发布科普信息,因此网络中科普信息量庞大,内容丰富多样,覆盖了不同学科、不同领域、不同地区、不同语言,在形式上包括文本、图像、声音、视频等多种类型的科普资源。网络中的大部分信息并未经过权威部门或专家认证,使得网络中的科普信息存在繁杂、混乱、质量参差不齐、可信性弱等特点,为信息的选择造成困难。“伪科普”看准了社交网络用户对科普知识的巨大需求量乘虚而入,利用社交网络信息生产平民化、互动性强等传播特点肆意泛滥于网络。对于个人来说,这些信息造成了许多人身与财产安全损失,对于社会而言也造成了许多舆情安全方面、文化发展发面、社会稳定方面的威胁。

基于大数据的云化新技术、AI技术、数据挖掘与分析技术,一方面对科普的发展提出了新的要求,另一方面促进科普升级的快速前行。为了向用户提供科学、权威、准确的科普信息内容,为了尽可能消除“伪科普”对个人和社会的负面影响,充分利用互联网中大量的科普资源,研究海量科普资源的可信度鉴证方法迫在眉睫。

发明内容

本发明的目的在于提供一种针对网络中的海量科普资源进行可信度鉴证的方法,有效的筛选更有价值的科普资源。

本发明的实施方式公开了一种海量科普资源的可信度鉴证方法,所述方法包括:

对资源爬取的数据进行抽取、转换,进行进一步的清洗、提取等处理,采集网址来源、制作机构及作者、时间属性、资源主题等关键信息进行结构化存储,再根据管理规则建立索引,形成资源库的融合数据目录,为各类服务提供数据支撑,从而构建出资源属性表;

建立资源属性表之后还需要进一步对资源进行分析、规类及整理,以一定的规则,依据属性表中来源、机构与作者的权威性等关键信息生成对应资源的可信程度值;

面向不同领域科普资源的数据特征,依托科普专家库等的现有科普相关专业机构及专家资源库,按照专家类别、擅长领域等规则形成专家特征值;

根据已构建的资源属性表、可信程度值及专家特征等一系列匹配规则,将分类的科普资源数据利用协同众包技术让对应的科普专家交叉打分、评价,进行资源鉴证。

可选地,科普资源采集以及数据融合,建立资源属性表,包括:

在对分散在全国乃至全世界互联网上的、由大量科普专业机构或网络平台、企事业单位、科研机构、专家自媒体等生产的海量华文、华语类科普资源进行网络爬取时,记录该资源网址所属机构、所属类别、作者、发布时间、文章来源;

根据上述采集得到的科普资源的机构、作者及作者所属机构、文章来源建立标签属性表;

根据采集科普资源的总体分布情况,建立资源属性表中属性之间的对应关系。

可选地,建立资源属性表中属性之间的对应关系包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海杰图智能科技有限公司,未经上海杰图智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911374626.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top