[发明专利]生物数据模式识别的多级体系构架在审
申请号: | 201680048013.3 | 申请日: | 2016-08-12 |
公开(公告)号: | CN107924430A | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | K·沃良斯基;N·迪米特罗娃 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王英,刘炳胜 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物 数据 模式识别 多级 体系 构架 | ||
1.一种用于检测至少一种生物体的成分中的模式的系统(100),所述系统由至少一个硬件处理器来实现并且包括:
数据预处理器(110),其被配置为从所述至少一种生物体的所述成分的基因组或蛋白质组数据中的至少一种汇编第一特征数据集;以及
聚类模块(112),其被配置为选择基因或蛋白质中的至少一种的不同子集,并且根据所述第一特征数据集中与选择的所述子集相对应的部分来识别所述成分的聚类,其中,所述聚类模块还被配置为计算针对所述成分的隶属度值,所述隶属度值指示在所述聚类内的隶属度,并且执行额外的聚类确定过程以获得成分的最终聚类,其中,所述额外的聚类确定过程基于所述隶属度值来对所述成分进行聚类。
2.根据权利要求1所述的系统,其中,所述聚类模块还被配置为迭代所述额外的聚类确定过程以获得所述最终聚类,其中,所述额外的聚类确定过程的每次迭代包括根据额外的特征数据集来确定所述成分的其他聚类,所述额外的特征数据集包括根据所述额外的聚类确定过程的先前运行确定的先前隶属度值的至少一部分。
3.一种用于检测至少一种生物体的成分中的模式的方法(200),所述方法由至少一个硬件处理器来实现并且包括:
从所述至少一种生物体的成分的基因组或蛋白质组数据中的至少一种汇编(202)第一特征数据集;
通过选择(210)基因或蛋白质中的至少一个的不同子集并且根据所述第一特征数据集中与选择的所述子集相对应的部分来识别(212)所述聚类以确定(208)所述成分的聚类,其中,所述确定包括计算(214)所述成分的隶属度值,所述隶属度值指示在所述聚类内的隶属度;并且
执行(208)额外的聚类确定过程以获得成分的最终聚类,其中,所述额外的聚类确定过程基于所述隶属度值来对所述成分进行聚类。
4.根据权利要求3所述的方法,其中,所述隶属度值是第一隶属度值,其中,所述执行(208)包括:根据第二特征数据集来识别(212)所述成分的第二聚类,所述第二特征数据集包括所述第一隶属度值的至少一部分;并且计算(214)所述成分的第二隶属度值,所述第二隶属度值指示在所述第二聚类内的隶属度。
5.根据权利要求4所述的方法,其中,所述执行(208)包括选择(210)所述第一隶属度值的所述至少一部分的不同子集,并且针对所述第一隶属度值的所述至少一部分的所述不同子集中的每个执行(212)聚类确定子过程以获得所述第二聚类。
6.根据权利要求4所述的方法,其中,所述确定(208)所述成分的聚类包括通过确定所述第一聚类中的聚类之间的冗余度来形成(216)所述第二特征数据集并且修剪(218)所述第一聚类的具有高于阈值的相应冗余度的至少一个对应聚类的所述隶属度值。
7.根据权利要求4所述的方法,还包括:
迭代所述执行(208)以获得所述最终聚类,其中,所述执行的每次迭代包括根据额外的特征数据集来识别(212)所述成分的其他聚类,所述额外的特征数据集包括根据所述执行的先前运行确定的先前隶属度值中的至少一部分。
8.根据权利要求7所述的方法,其中,所述执行的所述迭代中的至少一个包括选择(210)先前隶属度值中的所述至少一部分的不同子集,并且针对所述先前隶属度值的所述至少一部分的所述不同子集中的每个执行(212)聚类确定子过程。
9.根据权利要求8所述的方法,其中,所述执行的所述迭代中的至少一个包括通过确定所述其他聚类之间的冗余度来形成(216)对应的特征数据集,并且修剪(218)所述其他聚类的具有高于阈值的相应冗余度的至少一个对应聚类的所述隶属度值。
10.根据权利要求3所述的方法,其中,所述隶属度值表示隶属于对应聚类的概率。
11.根据权利要求3所述的方法,其中,所述确定或执行中的至少一个包括基于聚类冗余度计算来修剪(218)基因或蛋白质中的至少一个的所述不同子集。
12.根据权利要求3所述的方法,还包括:
显示(226)所述最终聚类或代表所述最终聚类的基因或蛋白中的至少一种的子集中的至少一个的表示,其中,所述显示包括显示针对所述最终聚类的临床或表型注释中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680048013.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置