[发明专利]基于组学数据挖掘的疾病—药物关联平台有效
| 申请号: | 201710946836.4 | 申请日: | 2017-09-30 |
| 公开(公告)号: | CN110021360B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 贺培凤;于琦;卢学春;何小峰;袁永旭;吴胜男;武建光;刘鸿齐;邰杨芳;郝亚楠;吕艳华 | 申请(专利权)人: | 山西医科大学 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B50/00;G16B25/00 |
| 代理公司: | 北京知本村知识产权代理事务所(普通合伙) 11039 | 代理人: | 刘江良 |
| 地址: | 030001 山*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据 挖掘 疾病 药物 关联 平台 | ||
1.一种基于组学数据挖掘的“疾病—药物”关联平台,包括预测工具模块、出版物模块和对外服务模块,其中:
预测工具模块是利用Python编程语言与MySQL数据库建立连接并进行操作,通过数据清洗、高表达基因计算、关联分析步骤构建“疾病—药物”关联模型;模块包含2个分析工具,一个是疾病和药物关联分析工具,另一个是高表达基因分析工具;检索结果以两个表格进行呈现:一个表格显示检索疾病或药物的相关性评分;另一个表格显示命中结果中各种疾病或药物出现的频次;
出版物模块展示的是研究者利用所述平台数据发表的相关论文题录,即链接全文,在论文题录下方以标签的形式着重显示此论文的研究重点以及值得借鉴学习的方面;
对外服务模块能够为研究者提供专门的数据处理以及分析的服务,注册用户向所述平台上传问题,这些问题将统一分类汇总传输给相应的后台,后台处理给出解决方法后所述平台及时反馈给用户;
所述关联平台其能够完成下述功能:
(1)获取系列Series描述信息,构建系列Series获取号字典:通过数据库自带的GUI接口下载全部的Series描述信息,下载的内容包含后续程序开发所需要的获取号Accession;利用Python编写程序抽取Series描述信息中的获取号Accession,建立Series获取号字典,存储在Accession .csv文件中;
(2)获取Series基因表达信息:根据获取号Accesion推断出MINiML压缩文件对应的网址, 然后获取相应的url,下载MINiML压缩文件;
(3)利用Python针对下载下来的MINiML压缩文件编写相应的解压缩程序,自动不间断的解压压缩文件;
(4)解压完成后,通过对解压得到的数据进行提取,得到同一个系列Series不同样本数据的来源信息,存储在group .txt文件中;并将不同样本数据中的基因表达值合并生成一个矩阵,存储在matrix .txt文件中,一个基因表达矩阵对应着一个系列Series的获取号Accesion;
(5)通过编写的程序对(4)中得到的基因表达值矩阵文件进行分析计算,得到上调高表达基因与下调低表达基因,分别存储在up .csv与down .csv文件中;
(6)将(5)中分析计算的基因表达矩阵文件的系列Series通过获取号Accesion与(2)中的系列Series匹配,解压得到每一个相匹配的系列Series所对应的平台Platform信息;然后选择平台Platform信息中的gene symbol信息,将gene symbol与(5)分析得到的上调高表达基因和下调低表达基因进行匹配,匹配得到的数据分别存储在up_symbol .csv与down_ symbol .csv文件中;
(7)关联分析:通过疾病与药物基因表达数据的负相关计算预测出疾病与药物之间的潜在关联。
2. 根据权利要求1所述的基于组学数据挖掘的“疾病—药物”关联平台,其特征在于:所述负相关计算是Jaccard相似系数算法:给定两个集合A ,B,Jaccard 系数定义为A与B交集的大小与A与B并集的大小的比值,对疾病的上调基因和药物的下调基因、疾病的下调基因和药物的上调基因分别做这个运算,最终计算出来的相关系数值用来预测相关性的强度,值越高相关性越强,预测出疾病与药物之间的潜在关联,如果该相关系数值是负数,则说明该药物对于该疾病具有潜在治疗作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西医科大学,未经山西医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710946836.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





