[发明专利]转录本确定方法有效
申请号: | 201480039309.X | 申请日: | 2014-07-04 |
公开(公告)号: | CN105408909B | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 安德烈亚斯·蒂尔克 | 申请(专利权)人: | 莱克斯奥根有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/24 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 钟晶;钟海胜 |
地址: | 奥地利*** | 国省代码: | 奥地利;AT |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种估计转录本丰度的方法,所述方法包括以下步骤:a)从所关心的遗传基因座的转录本的潜在混合物中获取转录本片段测序数据;b)将所述片段测序数据分配给所关心的基因座的遗传基因坐标,从而获得片段遗传基因坐标覆盖的数据集,各遗传基因坐标的覆盖相结合形成覆盖包络曲线;c)设置所述混合物的转录本的数量;d)为每个转录本i预先设置建模的基因覆盖的概率分布函数,i代表转录本的数值标识,其中所述概率分布函数由所述转录本i的权重因子αi与至少2个概率子函数j之和的数学乘积构成,j代表概率子函数的数值标识,每个概率子函数j用权重因子βi,j独立地加权;e)将每个转录本的概率分布函数相加,获得和函数;f)使所述和函数拟合到所述覆盖包络曲线,从而优化αi与βi,j的值来提高拟合;g)重复步骤e)和f),直到预先设置的收敛判据已经得到满足,从而获得所述混合物的每个转录本的估计转录本丰度,所述的估计转录本丰度用在收敛判据已经得到满足之后经优化的权重因子αi表示。 | ||
搜索关键词: | 转录本 概率分布函数 遗传基因 混合物 子函数 丰度 覆盖包络 片段测序 权重因子 数值标识 预先设置 和函数 拟合 判据 概率 收敛 覆盖 所关心的基因 遗传基因座 数据分配 数学乘积 数据集 重因子 加权 建模 相加 优化 基因 重复 | ||
【主权项】:
1.一种估计转录本丰度的方法,所述方法包括以下步骤:a)从所关心的遗传基因座的转录本的潜在混合物中获取转录本片段测序数据;b)将所述片段测序数据分配给所关心的基因座的遗传基因坐标,从而获得片段遗传基因坐标覆盖的数据集,各遗传基因坐标的所述覆盖相结合,形成覆盖包络曲线;c)设置所述混合物的转录本的数量;d)为每个转录本i预先设置建模的基因覆盖的概率分布函数,i代表转录本的数值标识,其中所述概率分布函数通过至少2个概率子函数j之和与所述转录本i的权重因子αi相乘来定义,j代表概率子函数的数值标识,每个概率子函数j用权重因子βi,j独立地加权;e)将每个转录本的概率分布函数相加,获得和函数;f)使所述和函数拟合到所述覆盖包络曲线,从而优化αi与βi,j的值来提高拟合;g)重复步骤e)和f),直到预先设置的收敛判据已经得到满足,从而获得所述混合物的每个转录本的估计转录本丰度,所述的估计转录本丰度用在收敛判据已经得到满足之后经优化的权重因子αi表示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于莱克斯奥根有限公司,未经莱克斯奥根有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480039309.X/,转载请声明来源钻瓜专利网。
- 上一篇:往复式电动工具
- 下一篇:鳐血管生成抑制因子1功能区变体JG55及其应用
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用