[发明专利]与基于网络的生物标记签名相关的系统和方法有效
| 申请号: | 201380039796.5 | 申请日: | 2013-06-21 |
| 公开(公告)号: | CN104704499B | 公开(公告)日: | 2018-12-11 |
| 发明(设计)人: | 弗洛里安·马丁;阿兰·塞韦尔;朱丽娅·亨格;曼纽尔·克劳德·派奇 | 申请(专利权)人: | 菲利普莫里斯生产公司 |
| 主分类号: | G06F19/12 | 分类号: | G06F19/12;G06F19/24 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李玲 |
| 地址: | 瑞士纳*** | 国省代码: | 瑞士;CH |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 网络 生物 标记 签名 相关 系统 方法 | ||
1.一种用于产生用于表型预测的分类器的计算机化方法,包括以下步骤:
(a)在处理装置处接收指示计算因果网络模型的数据,其中该数据表示促成表型的生物系统,并且该数据包括:
多个节点,表示所述生物系统中的生物实体;和
多个边,连接所述多个节点中的节点对,并且表示由节点表示的生物实体之间的关系;
其中,一个或多个边与方向值相关联,所述方向值表示由节点表示的生物实体之间的因果激活关系或因果抑制关系,并且其中每个节点通过边连接到至少一个其他节点;
(b)在所述处理装置处接收(i)与第一生物实体子集的在第一组条件下获得的活动相应的第一数据集合、以及(ii)与第一生物实体子集的在不同于第一组条件的第二组条件下获得的活动相应的第二数据集合,其中,所述第一组条件和所述第二组条件与所述表型相关;
(c)用所述处理装置计算与所述第一生物实体子集相应的第一节点子集的活动度量集合,每个活动度量表示来自b(i)的第一组条件下的第一度量与来自b(ii)的第二组条件下的第二度量之间的差别;
(d)通过对于第二节点子集中的每个特定节点,识别使差别声明最优化的活动值,用所述处理装置产生所述第二节点子集的推断的活动值集合,所述第二节点子集表示促成所述表型的、但是其活动在步骤(c)未被测量的生物实体候选,所述差别声明表示所述特定节点的活动值与在所述计算因果网络模型内所述特定节点通过边连接的节点的活动值或活动度量之间的差别,其中,所述差别声明取决于所述第二节点子集中的每个节点的活动值;和
(e)用所述处理装置使用机器学习技术、使用所述活动度量集合和所述活动值集合两者作为输入来产生用于所述表型的分类器。
2.根据权利要求1所述的计算机化方法,其中,在步骤(e)产生用于所述表型的分类器包括:
(e1)产生作用于包括所述第一生物实体子集的活动度量的第一矢量以产生包括所述第二节点子集的活动值的第二矢量的算子;
(e2)使用所述算子识别要被用作机器学习技术中的内核的所述第二节点子集的子集;和
(e3)将所识别的子集作为输入提供给所述机器学习技术。
3.根据权利要求1-2中的任何一个所述的计算机化方法,其中,对于多个计算因果网络模型执行步骤(a)、(b)、(c)和(d),并且将与每个计算因果网络模型相应的活动值集合聚集成包含要在步骤(e)由机器学习技术使用的活动值集合的矩阵。
4.根据权利要求3所述的计算机化方法,其中,对于多个计算因果网络模型执行步骤(a)、(b)、(c)、(d)和(e),并且还包括:
(h1)对于每个分类器,跨多个计算因果网络模型识别第二生物实体集合的具有高于阈值的分类性能统计数据的一个或多个生物实体;和
(h2)将所识别的所有生物实体聚集成高性能实体集合;
(h3)用所述处理装置使用机器学习技术、基于与所述高性能实体集合相关联的活动值来产生生物状况的新的分类器;和
(h4)输出所述新的分类器。
5.根据权利要求1所述的计算机化方法,其中,所述机器学习技术包括支持矢量机技术。
6.根据权利要求1所述的计算机化方法,其中,所述差别声明还取决于所述第二节点子集中的每个节点和第二节点子集中的每个节点所连接到的节点之间的边的方向值。
7.根据权利要求1所述的计算机化方法,其中,所述活动值集合中的每个活动值是所述活动度量集合中的活动度量的线性组合。
8.根据权利要求7所述的计算机化方法,其中,所述线性组合取决于所述第一节点子集中的节点与所述第二节点子集中的节点之间的边,并且还取决于所述第二节点子集中的节点之间的边。
9.根据权利要求7所述的计算机化方法,其中,所述线性组合不取决于所述第一节点子集中的节点之间的边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菲利普莫里斯生产公司,未经菲利普莫里斯生产公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380039796.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于记录的加密数据储存器
- 下一篇:可搜索的经加密的数据
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





