[发明专利]基于组学数据挖掘的疾病—药物关联平台有效
| 申请号: | 201710946836.4 | 申请日: | 2017-09-30 |
| 公开(公告)号: | CN110021360B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 贺培凤;于琦;卢学春;何小峰;袁永旭;吴胜男;武建光;刘鸿齐;邰杨芳;郝亚楠;吕艳华 | 申请(专利权)人: | 山西医科大学 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B50/00;G16B25/00 |
| 代理公司: | 北京知本村知识产权代理事务所(普通合伙) 11039 | 代理人: | 刘江良 |
| 地址: | 030001 山*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于组学数据挖掘的“疾病—药物”关联平台,该平台包括预测工具模块、出版物模块和对外服务模块。本发明提供的“疾病—药物”关联平台,可以计算与疾病和药物相关的高表达基因,通过基因表达数据的负相关计算,预测出疾病与药物之间的潜在关联。可大大提高药物研发的精准性及针对性,为提升临床诊治水平提供引领和支撑;实现组学数据及表观组学数据的深度挖掘,使之服务社会、经济;可促进临床领域科学假说的生成,加快治疗的研究进程,推动临床相关学科发展;可迅速推进药物开发的产业化,从而创造可观的市场价值,促进国民经济快速发展。 | ||
| 搜索关键词: | 基于 数据 挖掘 疾病 药物 关联 平台 | ||
【主权项】:
1.一种基于组学数据挖掘的“疾病—药物”关联平台,包括预测工具模块、出版物模块和对外服务模块,其中:预测工具模块主要是利用Python编程语言与MySQL数据库建立连接并进行操作,通过数据清洗、高表达基因计算、关联分析步骤构建“疾病—药物”关联模型;主要包含2个分析工具,一个是疾病和药物关联分析工具,另一个是高表达基因分析工具;检索结果以两个表格进行呈现:一个表格显示检索疾病或药物的相关性评分;另一个表格显示命中结果中各种疾病或药物出现的频次;出版物模块主要展示的是研究者利用所述平台数据发表的相关论文题录,即链接全文,在论文题录下方以标签的形式着重显示此论文的研究重点以及值得借鉴学习的方面;对外服务模块主要为研究者提供专门的数据处理以及分析的服务,注册用户可以向所述平台上传问题,这些问题将统一分类汇总传输给相应的后台,后台处理给出解决方法后所述平台会及时反馈给用户;所述关联平台其能够完成下述功能:(1)获取系列Series描述信息,构建系列Series获取号(Accesion)字典:通过数据库自带的GUI接口下载全部的的Series描述信息,下载的内容包含后续程序开发所需要的序列号Accession;利用Python编写程序抽取Series描述信息中的Accession号,建立Series获取号字典,存储在Accession.csv文件中;(2)获取Series基因表达信息:根据获取号Accesion推断出MINiML文件对应的网址,然后获取相应的url,下载MINiML文件;(3)利用Python针对下载下来的MINiML压缩文件编写相应的解压缩程序,自动不间断的解压压缩文件;(4)解压完成后,通过对解压得到的数据进行提取,得到同一个系列Series不同样本数据的来源信息,存储在group.txt文件中;并将不同样本数据中的基因表达值合并生成一个矩阵,存储在matrix.txt文件中;(5)通过编写的程序对(4)得到的数据进行分析计算,得到上调高表达基因与下调低表达基因,分别存储在up.csv与down.csv文件中;计算分析,给出“...发现了**个上调基因,**个下调基因”的信息,计算结果会存储在up.csv与down.csv文件中;(6)将(5)中得到的系列Series与(2)中的系列Series匹配,解压得到每一个相匹配的系列Series所对应的平台信息;然后选择平台Platform信息中的gene symbol信息,将gene symbol与(5)得到的数据进行匹配,匹配得到的数据分别存储在up_symbol.csv与down_symbol.csv文件中;(7) 关联分析:通过疾病与药物基因表达数据的负相关计算预测出疾病与药物之间的潜在关联。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西医科大学,未经山西医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710946836.4/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





