[发明专利]科研文献的结构化信息提取方法及系统在审

专利信息
申请号: 201811627398.6 申请日: 2018-12-28
公开(公告)号: CN109977112A 公开(公告)日: 2019-07-05
发明(设计)人: 薛成海;马熹;王晓君;闫琛;刘畅 申请(专利权)人: 万康源(天津)基因科技有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/26;G06Q50/18
代理公司: 天津企兴智财知识产权代理有限公司 12226 代理人: 李成运
地址: 300220 天津市河西区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结构化信息 科研 科研思路 软件算法 实验操作 文献内容 样本信息 重要结果 保证
【说明书】:

发明提出一种科研文献的结构化信息提取方法及系统,包括:使用表格的形式将文献中的样本信息进行提取呈现;文献中的科研思路利用流程图的形式提取呈现,流程图的节点代表文献中使用的“方法处理”,包括实验操作、软件算法。本发明能够使用规范的形式将科研文献的主要结果和结论转述出来,供其他科研工作者查看,以方便他们可以快速了解到科研文献的主要内容。通过本发明,能够保证结构化信息提取的内容与原文献内容一致,简明、准确的对科研文献重要结果和结论进行陈述。

技术领域

本发明属于信息系统领域,特别是涉及到一种科研文献的结构化信息提取方法及系 统。

背景技术

随着科研投入的不断增加,以及高通量生物技术的发展,实验手段与研究方法都取 得了巨大的进步,而由此带来的大量科研成果都是以文献的形式发表在各类期刊上。这些文献汇集了大量的研究成果,记载了技术难题的解决方案,而且不断反映各种技术领 域最新科技成果,为科研人员相互学习借鉴世界先进技术提供了重要的媒介。各类期刊 都会对文献的结构、篇幅有一定的限制,这就导致了科研文献必须足够精炼,但是又必 须能够涵盖作者的研究目的、思路、结果、结论等信息。这就给其他阅读文献的人,增加 了相应的理解难度。再加上大部分重要的科研文献都是以外文形式发表的,这就给母语 非英语的科研工作者难上加难了。对于国内科研工作者,不仅仅需要他们具有一定的专 业知识的储备,同时还必须能够熟练的使用外文。即便如此,完全弄明白一篇外文科研 文献中的主要结论以及创新点也可能需要花费大量的时间。

因此,在国内的科研论坛或其他工具上经常可以看到有的科研工作者在理解某一篇 文献后,用自己的语言将文献的主要结果和结论转述出来(这个过程称为“结构化信息提取”),供其他科研工作者查看,以方便他们可以快速了解到文献的主要内容。这种转 述呈现的形式可能因人而异,如果不是即时交流,一般是采用原文图表加上自己(翻译) 的语言这种形式。这就完全依赖转述者自身的偏好了。而且,转述的内容与原文献内容 是否一致,以及是否转述者是否能够真正准确的了解到文献重要结果和结论,都完全依 赖于转述者自身科研素养。

上述情况会导致科研文献的结构化信息提取不准确,或者呈现的内容并非重点、难 以理解等问题。

发明内容

有鉴于此,本发明提出一种科研文献的结构化信息提取方法及系统,简明、准确的完成结构化信息提取和呈现。

为达到上述目的,本发明的技术方案是这样实现的:

一种科研文献的结构化信息提取方法,包括:使用表格的形式将文献中的样本信息 进行提取呈现;文献中的科研思路利用流程图的形式提取呈现,流程图的节点代表文献中使用的“方法处理”,包括实验操作、软件算法。

进一步的,所述使用表格的形式将文献中的样本信息进行提取呈现,包括:

(1)表格设置为样本标签表与样本表;

(2)提取文献中样本类型或者分组情况使用样本标签表呈现;样本标签表包括标签 缩写、标签名称、标签备注;

(3)提取文献中必要的样本信息使用样本表呈现;样本表包括样本编号、组内编号、 样本标签、样本来源、样本操作和样本备注;所述样本表中的样本标签对应样本标签表的标签缩写。

更进一步的,所述样本表使用缩略模式,单个样本一一展示,批量样本只展示第一个与最后一个。

进一步的,所述流程图的节点呈现内容还包括:

(1)样本的使用情况:提取文献中该节点的“方法处理”用到哪些样本,或者是用到来源于哪些样本得到的后续数据;

(2)结果:提取文献中的图结果、表结果、文字结果,来表示该节点的“方法处理”所得结果;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万康源(天津)基因科技有限公司,未经万康源(天津)基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811627398.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top