[发明专利]异常微阵列特征的识别有效
申请号: | 201210140069.5 | 申请日: | 2012-05-03 |
公开(公告)号: | CN102841986B | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 保罗·肯尼斯·沃伯;罗伯特·佩吉 | 申请(专利权)人: | 安捷伦科技有限公司 |
主分类号: | G06F19/20 | 分类号: | G06F19/20 |
代理公司: | 北京东方亿思知识产权代理有限责任公司11258 | 代理人: | 肖善强 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 阵列 特征 识别 | ||
技术领域
本公开涉及异常微阵列特征的识别。
背景技术
在阵列分析中,为了避免微阵列数据集合被不良品质的数据污染,识别和标记异常特征(即展现与众不同的统计学性质或形态性质的特征)是重要的。本公开涉及识别异常微阵列特征的方法。
发明内容
本文描述了一种识别核酸阵列中的异常特征的方法。概括地,本发明包括:a)提供log变换的归一化值(log transformed normalized value),所述log变换的归一化值表示测试样品对核酸阵列中的第一特征的杂交量;b)利用所述log变换的归一化值和表示对照样品对多个参比阵列中的同一特征的杂交量的参比log变换的归一化值的分布来计算所述第一特征的z得分;以及c)如果存在高于或低于规定的阈值的z得分,那么识别所述测试特征是异常的。
附图说明
图1是表示本发明方法的一个实施方式的一些方面的流程图。
图2是表示本发明方法的另一实施方式的一些方面的流程图。
图3是高%CV载玻片(slide)上的八个阵列的z得分图。
图4是载玻片252665211142的z得分图。
图5是载玻片252665211142的二元标记图。
图6表示在被标记为具有低z得分的各个阵列中各特征分数的柱图。
定义
本文中使用的术语“样品”是指,含有感兴趣的一个或多个核酸(DNA或RNA)分析物的原料或原料混合物,其通常是液体形式,但并非必然是液体形式。
本文中使用的术语“以生物学方式衍生的样品”是指,由活细胞制成或衍生得到的核酸样品。由生物体的组织(例如活体解剖等)或细胞系(包括其冷冻或贮藏形式)制成的样品是以生物学方式衍生的样品的实例。
本文中使用的术语“以非生物学方式衍生的样品”是指,由预定的合成方式制备的寡核苷酸组成的核酸样品。美国专利申请公开号US20060121491中描述了以非生物学方式衍生的样品的实例。
本文中使用的术语“测试样品”是指,研究中的样品。
本文中使用的术语“对照样品”是指,可与测试样品比较的样品。正如以下更详细描述地,相对于测试样品,对照样品可以是例如同一样品的不同等分试样;可以来自同一组织;或者来自同一细胞系。
术语“核苷酸”意欲包括如下这些片段,这些片段不仅包含已知的嘌呤和嘧啶碱基,还包含已被修饰的其他杂环碱基的片段。所述修饰包括甲基化的嘌呤或嘧啶、酰基化的嘌呤或嘧啶、烷基化的核糖或其他杂环。另外,术语“核苷酸”还包括如下这些片段,这些片段包含半抗原或荧光标记,而且还可以包含常规核糖和脱氧核糖糖类,以及其他糖类。经修饰的核苷酸或核苷酸还包括,在糖片段上的修饰,例如在羟基基团中的一个或多个被卤原子或脂族基团替代时,被功能化成醚类、胺类等等。核苷酸可以包括,当被掺入核酸的伸展链中时能够继续伸展的那些(非链终止核苷酸)和抑制随后伸展的那些(例如链终止剂)。
术语“核酸”和“聚核苷酸”在本文可互换使用,用于描述由诸如脱氧核糖核苷酸或核糖核苷酸的核苷酸构成的并且具有例如大于约2个碱基、大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基、直至约10000或更多个碱基的任意长度的聚合物,其可以通过酶促方式或合成方式(例如在美国专利号5,948,902以及其中引用的参考文献中所描述的PNA)生产,其可以序列特异性方式与天然核酸杂交(类似于两种天然核酸那样杂交),例如可以参与Watson-Crick碱基对相互作用。天然存在的核苷酸包括鸟嘌呤、胞核嘧啶、腺嘌呤、尿嘧啶和胸腺嘧啶(分别为G、C、A、U和T)。
本文中使用的“寡核苷酸”表示,由约2至5000个核苷酸(例如2至200个核苷酸)构成的核苷酸的单链多聚体。寡核苷酸可以是合成的,或者可以以酶促方式制成,在一些实施方式中,其具有小于10至50个核苷酸的长度。寡核苷酸可以包含核糖核苷酸单体(即可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。寡核苷酸可以具有例如10至20个、11至30个、31至40个、41至50个、51至60个、61至70个、71至80个、80至100个、100至150个、或150至200个、直至500个或更多个核苷酸长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安捷伦科技有限公司,未经安捷伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210140069.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带双小车和平衡端梁的悬臂起重机
- 下一篇:一种桥式起重机轨道清灰装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用