[发明专利]一种通过协同过滤公共数据库发现肿瘤潜在基因标靶的方法有效
申请号: | 201610879877.1 | 申请日: | 2016-10-09 |
公开(公告)号: | CN106650317B | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 江经纬;孙媛媛 | 申请(专利权)人: | 南京双运生物技术有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B45/00;G16B20/50 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 顾进 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种通过协同过滤公共数据库发现肿瘤潜在基因标靶的方法,该方法采用了基于已知的肿瘤基因靶标数据库和属于不同肿瘤之间的Jaccard系数,挖掘出在某肿瘤中已经发现,但在另一种肿瘤中还没有发现的基因靶标。本发明的方法相比于传统的人工检索发现肿瘤潜在基因靶标的方法,能大幅提升科研效率,提高潜在肿瘤靶标的研究命中率,最大程度上利用多种公共数据库的资源,节省大量实验成本。 | ||
搜索关键词: | 一种 通过 协同 过滤 公共 数据库 发现 肿瘤 潜在 基因 方法 | ||
【主权项】:
1.一种通过协同过滤公共数据库发现肿瘤潜在基因标靶的方法,其特征在于,所述的方法包括如下操作步骤:1)利用图论的原理,根据肿瘤基因数据库内的信息,建立肿瘤基因数据库内所有肿瘤类型和其对应突变基因的二分图,其中,建立二分图的过程中,定义两种节点,一种节点为肿瘤类型,另一种节点为突变基因;定义:肿瘤类型X和在肿瘤基因数据库公布的该肿瘤类型X对应的突变基因之间有边,定义:不同肿瘤类型之间没有边,定义:不同突变基因之间也没有边;2)从二分图中选出指定肿瘤类型A,其他所有肿瘤类型均为目标肿瘤类型B,计算指定肿瘤类型A与目标肿瘤类型B之间的Jaccard值,具体计算公式如下:
其中,|A|为肿瘤类型A的突变基因数量,|B|为肿瘤类型B的突变基因数量, |A∩B|为肿瘤类型A和肿瘤类型B公有的突变基因数量,|A∪B|为存在于肿瘤类型A或肿瘤类型B公有的突变基因数量,经计算得到的Jaccard值,得出指定肿瘤类型A与目标肿瘤类型B之间的相似度;3)重复步骤2),分别计算指定肿瘤类型A与肿瘤基因数据库内其他所有目标肿瘤类型B的Jaccard值,选取Jaccard值大于0的目标肿瘤类型B1、B2、B3……Bn;4) 从肿瘤基因数据库内选取步骤3)中Jaccard值大于0的目标肿瘤类型B1、B2、B3……Bn所对应的不存在于指定肿瘤类型A的突变基因B11’… B1i’、B21’ … B2j’、 B31’ … B3j’、 …、Bn1’ … Bnm’;将目标肿瘤类型Bi与指定肿瘤类型A的Jaccard值对应赋予目标肿瘤类型Bi的所有相关突变基因Bi1’… Biq’;5)将步骤4)中所对应的突变基因B11’… B1i’、B21’ … B2j’、B31’ … B3j’、…、Bn1’ … Bnm’的同名突变基因的Jaccard值进行相加;6)按照相加后Jaccard值的高低排列目标肿瘤类型A所对应的突变基因,根据Jaccard值高低判断突变基因是否是指定肿瘤类型的潜在基因靶标;7)查找文献,确定步骤6)中潜在基因靶标是否在指定肿瘤类型A的领域内没有被研究过。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京双运生物技术有限公司,未经南京双运生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610879877.1/,转载请声明来源钻瓜专利网。