[发明专利]基于组学数据挖掘的疾病—药物关联平台有效
| 申请号: | 201710946836.4 | 申请日: | 2017-09-30 |
| 公开(公告)号: | CN110021360B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 贺培凤;于琦;卢学春;何小峰;袁永旭;吴胜男;武建光;刘鸿齐;邰杨芳;郝亚楠;吕艳华 | 申请(专利权)人: | 山西医科大学 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B50/00;G16B25/00 |
| 代理公司: | 北京知本村知识产权代理事务所(普通合伙) 11039 | 代理人: | 刘江良 |
| 地址: | 030001 山*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据 挖掘 疾病 药物 关联 平台 | ||
本发明公开了一种基于组学数据挖掘的“疾病—药物”关联平台,该平台包括预测工具模块、出版物模块和对外服务模块。本发明提供的“疾病—药物”关联平台,可以计算与疾病和药物相关的高表达基因,通过基因表达数据的负相关计算,预测出疾病与药物之间的潜在关联。可大大提高药物研发的精准性及针对性,为提升临床诊治水平提供引领和支撑;实现组学数据及表观组学数据的深度挖掘,使之服务社会、经济;可促进临床领域科学假说的生成,加快治疗的研究进程,推动临床相关学科发展;可迅速推进药物开发的产业化,从而创造可观的市场价值,促进国民经济快速发展。
技术领域
本发明属于生物医药技术领域,特别是一种针对癌症等疑难杂症的 “疾病—药物”关联平台。
背景技术
高通量检测技术的成熟及广泛应用,使得临床生物学数据大幅增长,而今已步入生物信息学数据呈指数级增长的时代。生物医学实验中出现如MicroArray的新型数据,逐步成为当今生物医学实验研究的支柱。并且促成了大型基因芯片数据的建立,如NCBI的GEO(Gene Expression Omnibus)和EBI的 ArrayExpress,MIT的ChipDB。许多生物的基因组和各阶段生命过程,作用机理等知识的研究资料、研究成果和实验数据,被包含在相应物种的专门数据库或相应数据类型的大型数据库中。生物信息数据库不仅包含疾病、生物基因、遗传、表型数据和其他多态性等基因表达数据,供研究者使用,而且这些蕴含丰富数据的数据库在临床生物学研究中具有重要的作用。
GEO数据库具有很强的开放性和灵活性,为临床生物信息学研究者提供了实用的挖掘平台,愈来愈多的生物信息学者将会更加青睐这一平台。面对海量的基因表达数据,当前面临的挑战不再是海量数据的获取问题,主要挑战在于解释和分析这些数据,尝试从这些大量基因表达数据中挖掘出潜在的规律,发现“疾病—药物”潜在的关联,从而为癌症等难治疾病提供新的治疗思路和方案,给人类带来福音。
发明内容
本发明针对现有的技术搭建了“疾病—药物”关联分析平台,主要可以计算与疾病和药物相关的高表达基因,通过基因表达数据的负相关,预测出针对疾病和药物(化合物)之间的潜在关联。 本发明提供的技术方案是:一种基于组学数据挖掘的“疾病—药物”关联平台,包括预测工具模块、出版物模块和对外服务模块,其中:
预测工具模块主要是利用Python编程语言与MySQL数据库建立连接并进行操作,通过数据清洗、高表达基因计算、关联分析步骤构建“疾病—药物”关联模型;主要包含2个分析工具,一个是疾病和药物关联分析工具,另一个是高表达基因分析工具;检索结果以两个表格进行呈现:一个表格显示检索疾病或药物的相关性评分;另一个表格显示命中结果中各种疾病或药物出现的频次;
出版物模块主要展示的是研究者利用所述平台数据发表的相关论文题录,即链接全文,在论文题录下方以标签的形式着重显示此论文的研究重点以及值得借鉴学习的方面;
对外服务模块主要为研究者提供专门的数据处理以及分析的服务,注册用户可以向所述平台上传问题,这些问题将统一分类汇总传输给相应的后台,后台处理给出解决方法后所述平台会及时反馈给用户;
所述关联平台其能够完成下述功能:
(1)获取系列Series描述信息,构建系列Series获取号(Accesion)字典:通过数据库自带的GUI接口下载全部的Series描述信息,下载的内容包含后续程序开发所需要的序列号Accession;利用Python编写程序抽取Series描述信息中的Accession号,建立Series获取号字典,存储在Accession.csv文件中;
(2)获取Series基因表达信息:根据获取号Accesion推断出MINiML文件对应的网址,然后获取相应的url,下载MINiML文件;
(3)利用Python针对下载下来的MINiML压缩文件编写相应的解压缩程序,自动不间断的解压压缩文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西医科大学,未经山西医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710946836.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





