[发明专利]生物标记提取装置及其方法有效
申请号: | 201110342753.7 | 申请日: | 2011-10-27 |
公开(公告)号: | CN102542179A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 尹泓皙;宣忠贤;朴仁镐 | 申请(专利权)人: | 三星SDS株式会社 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 韩明星 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物 标记 提取 装置 及其 方法 | ||
1.一种生物标记提取装置,所述装置分析在序列上出现的变异对基因功能导致的变化,提取成为特定疾病的原因的生物标记,其特征在于,包括:
一预处理部,分析基因试样的序列,提取在基因上定位的变异数据;
一危害性预测器,定量由于所述变异数据在所述基因功能上发生的障碍,而求出危害性分数;
一模块化部,在基因网络,探索所述危害性分数在预定临界值以上的基因集合的子模块。
2.根据权利要求1所述的生物标记提取装置,其特征在于,
所述预处理部包括:
一疾病群比较部,互相比较疾病群变异与正常群变异,在所述分析的基因试样中获取所述疾病群中存在的变异;
一变异提取部,参照公知的变异数据库,在所述获取的疾病群变异中提取新变异;
一变异定位部,在功能性基因上定位所述提取的新变异。
3.根据权利要求2所述的生物标记提取装置,其特征在于,所述变异定位部,在所述提取的新变异中,只提取在表达为蛋白质时氨基酸改变的种类,并在所述功能性基因上进行定位。
4.根据权利要求1所述的生物标记提取装置,其特征在于,所述危害性预测器包括危害性计算部,所述危害性计算部在多个危害性预测模型上适用所述变异数据而获得各个危害性后,在所述各个危害性上适用权重值而计算权重危害性。
5.根据权利要求4所述的生物标记提取装置,其特征在于,
所述危害性计算部包括:
一特征向量产生部,其从所述变异数据产生包含多样的要素的特征向量;
一适配器,在所述产生的特征向量中选出各个预测模型所需要素;
两个以上的预测模型,输入所述选出的要素,就能够在蛋白质序列内发现个别的非同义单核苷酸多态性;
一权重值适用部,在所述预测模型的输出上适用权重值进行合计。
6.根据权利要求5所述的生物标记提取装置,其特征在于,所述权重值适用部,将所述预测模型的输出正规化为0至1之间的值后,适用所述权重值进行合计,并将所述合计的结果正规化为0至1之间的值。
7.根据权利要求5所述的生物标记提取装置,其特征在于,所述特征向量,在定位基因变异的基因及蛋白质的相应位置上氨基酸的各种生物种间的保守性分数、氨基酸取代导致的生物化学性质的变化、蛋白质结构特征的变化、有无内含子切接点位置、5端非翻译区变异位置中,包括两个以上。
8.根据权利要求5所述的生物标记提取装置,其特征在于,所述预测模型,在SIFT、PolyPhen、MAPP中,至少包括一个。
9.根据权利要求4所述的生物标记提取装置,其特征在于,所述危害性预测器还包括:
一重要性计算部,基于所述变异数据的频率计算相应基因变异的重要性;
一分数计算部,组合所述权重危害性及所述重要性,而计算危害性分数。
10.根据权利要求9所述的生物标记提取装置,其特征在于,所述重要性计算部,根据相应基因变异在疾病群试样中出现的概率,计算所述重要性,并且所述概率是最大似然估计或贝叶斯概率。
11.根据权利要求9所述的生物标记提取装置,其特征在于,所述分数计算部,在一个基因内基因变异所具有的危害性分数的和,除以所述基因的长度,而求出最终危害性分数。
12.根据权利要求1所述的生物标记提取装置,其特征在于,所述模块化部,基于现在的基因节点的集合上合并邻接基因是否显著,而重复进行更新基因网络的过程,而探索所述子模块。
13.根据权利要求12所述的生物标记提取装置,其特征在于,所述模块化部,利用在所述危害性分数超过预定临界值的基因数量的超几何分布中获得的概率,判断所述显著性。
14.根据权利要求13所述的生物标记提取装置,其特征在于,所述预定临界值以整个基因的危害性分数分布中预定百分位数为准而决定。
15.根据权利要求1所述的生物标记提取装置,其特征在于,还包括网络合并部,在公知的蛋白质相互作用数据库中合并从求出所述危害性分数的基因表达的蛋白质,而形成相互作用网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110342753.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用