[发明专利]用于基因组组装及单体型定相的方法有效
申请号: | 201480020008.2 | 申请日: | 2014-01-31 |
公开(公告)号: | CN105121661B | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 小R·E·格林;L·F·拉里奥 | 申请(专利权)人: | 加利福尼亚大学董事会 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陈建芳;阎娬斌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 组装 单体型 宏基因组分析 数据分析 可用 应用 | ||
1.一种用于基因组组装的方法,其包括:
获得多个重叠群;
获得重构染色质,所述重构染色质包含与分离的核蛋白复合的裸DNA;
从通过探测重构染色质的物理布局产生的数据中,生成多个读对;
将所述多个读对定位至所述多个重叠群,从而产生读段定位数据;
使用所述读段定位数据排列所述重叠群;以及
确定经过所述重叠群的路径,所述路径代表所述重叠群的次序和/或朝着基因组的方向。
2.根据权利要求1所述的方法,其中所述多个重叠群通过使用鸟枪测序法生成,所述鸟枪测序法包括:
使长段的受试者DNA断裂成大小不确定的随机片段;
用高通量测序法对所述片段进行测序,以生成多个测序读段;和
组装所述测序读段,以形成多个重叠群。
3.根据权利要求1或权利要求2所述的方法,其中通过使用包括下述步骤的技术,通过探测重构染色质的物理布局,生成所述多个读对:
使重构染色质与固定剂交联,以形成DNA-蛋白质交联物;
用一种或多种限制性内切酶切割交联的DNA-蛋白质,以生成含有粘性末端的多个DNA-蛋白质复合物;
用含有一种或多种标记物的核苷酸补平所述粘性末端,产生平末端随后使平末端连接在一起;
使所述多个DNA蛋白质复合物断裂为片段;
通过使用一种或多种标记物,拉下含有接点的片段;和
用高通量测序法对所述含有接点的片段进行测序,以生成多个读对。
4.根据权利要求1所述的方法,其中所述多个读对是通过探测重构染色质的物理布局生成的,所述重构染色质是通过将获自一个或多个受试者样本的裸DNA与分离的组蛋白复合形成的。
5.根据权利要求1所述的方法,其中对于所述多个读对,通过采用所述读段到所述重叠群边缘的距离的函数,加权至少80%的读对,体现短接触比长接触更高的概率。
6.根据权利要求1所述的方法,其中所述方法提供人类受试者的基因组组装,其中从人类受试者的DNA生成多个重叠群,而且其中通过使用由受试者裸DNA制得的重构染色质,生成多个读对。
7.根据权利要求1所述的方法,其中所述方法进一步包括:
识别所述多个读对中的一个或多个杂合位点;和
识别含有成对杂合位点的读对,其中从所述成对杂合位点的识别,能够确定用于等位基因变异体的定相数据。
8.根据权利要求1所述的方法,其中从单个DNA分子获得所述多个读对,其中至少1%的读对跨越单个DNA分子上的至少30kB的距离,并且其中所述读对在14天内生成。
9.根据权利要求8所述的方法,其中至少10%的所述读对跨越所述单个DNA分子上的至少50kB的距离。
10.根据权利要求8所述的方法,其中至少1%的所述读对跨越所述单个DNA分子上的至少100kB的距离。
11.根据权利要求1所述的方法,其中所述读对在7天内生成。
12.根据权利要求1所述的方法,其中在体外从单个DNA分子获得所述多个读对;其中至少1%的所述读对跨越所述单个DNA分子上的至少30kB的距离。
13.根据权利要求12所述的方法,其中至少10%的所述读对跨越所述单个DNA分子上的至少30kB的距离。
14.根据权利要求13所述的方法,其中至少1%的所述读对跨越所述单个DNA分子上的至少50kB的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加利福尼亚大学董事会,未经加利福尼亚大学董事会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480020008.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型钢绞线的连续清洗装置
- 下一篇:非复制型病毒衍生颗粒及其用途