[发明专利]一种基于JSON的基因本体映射系统及方法有效

专利信息
申请号: 202011090831.4 申请日: 2020-10-13
公开(公告)号: CN112187953B 公开(公告)日: 2022-05-03
发明(设计)人: 刘健;陈娇;陈萍 申请(专利权)人: 南开大学
主分类号: H04L67/02 分类号: H04L67/02;H04L67/06;H04L67/565;H04L67/563;G06F16/21
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 徐思波
地址: 300110*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 json 基因 本体 映射 系统 方法
【说明书】:

发明公开了一种基于JSON的基因本体映射系统及方法,包括基因本体的自动识别与数据抽取,从基因本体到JSON的映射机制及基于JSON的基因本体数据存储。具体步骤为:识别基因本体中的元数据信息,获取基因本体元数据中的细胞组分(cellular component)、分子功能(molecular function)、生物过程(biological process)三个类别以及父子关系(is_a)、部分关系(part_of)和调控关系(regulates)三种关系特征;建立基因本体元数据特征与JSON模型的一一对应映射规则,采用半监督学习方法完成元数据抽取;构建基于JSON的基因本体存储模型,完成从基因本体到JSON的数据迁移。本发明建立了基因本体与JSON的映射模型,解决了基因本体数据无法自动转换成JSON数据的难题,实现了基因本体在异构Web平台间的高效数据交互与充分共享。

技术领域

本发明涉及数据迁移与本体映射技术,特别涉及一种基于JSON的基因本体映射系统及方法。

背景技术

21世纪人类基因组计划完成之后,以美国为代表的世界主要发达国家纷纷启动了大量生命科学基础研究计划驱动了各种基因组学、疾病等相关生物数据库的爆炸式增长。由于各生物数据库的数据描述方法有一定差异,存在着大量的语义异构信息。为了充分利用这些生物数据库包含的知识,学术界和工业界广泛使用生物学本体来整合异构生物知识。作为一种广泛使用的生物学本体,基因本体主要用于描述基因和基因产物的属性,如细胞组分、分子功能、生物过程以及父子关系、部分关系和调控关系等。

随着Web技术的不断发展,越来越多的生物学家通过Web服务来管理和利用基因本体知识。在当前网页端和移动终端普及的情况下,迫切需要支持跨平台的高效数据交互方式以便网页端和移动端快速获取基因本体信息。作为轻量级数据交换的首选,JSON无需在客户端封装其他应用程序即可完成数据加载和解析,具有高效跨平台数据传输以及客户端和服务器端快速响应处理的特点。为了实现基因本体在异构Web平台间的高效数据交互与充分共享,需要研发基因本体与JSON的映射方法与系统,提供从基因本体到JSON的自动转换技术解决方案。

发明内容

针对缺乏有效的映射机制所造成的基因本体在异构Web平台间数据交互与共享的瓶颈问题,本发明提供了一种基于JSON的基因本体映射系统及方法。

本发明所采用方法的技术方案是:

(1)解析所述基因本体数据表示格式(Open Biomedical Ontologies,OBO格式),识别基因本体OBO格式版本(format-version)、对象类标识号(id)、名称(name)、命名空间(namespace)等元数据信息,获取基因本体元数据类别及关系特征;

(2)以基因本体术语(term)对象为划分单元,建立基因本体术语与JSON对象数组之间以及基因本体对象tag-value对与JSON对象key-value对之间的映射关系,采用半监督学习方法抽取上述元数据;

(3)将基因本体数据转换存储到JSON文件中,完成从基因本体到JSON的数据迁移。

所述系统包括以下功能模块:

(1)数据预处理模块,用于加载获取的基因本体OBO数据;

(2)数据抽取模块,用于使用半监督学习方法抽取基因本体格式版本、对象类标识号、名称、命名空间等元数据;

(3)数据转换模块,用于通过基因本体与JSON映射模型将上一步抽取获得的基因本体元数据转换成为JSON数据;

(4)数据存储模块,用于存储上一步获得的JSON迁移数据;

(5)可视化模块,用于提供映射规则筛选和管理、数据统计分析以及上述所有功能模块的可视化操作界面。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011090831.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top