[发明专利]一种猪全基因组sgRNA文库及其构建方法和应用在审
申请号: | 201711490244.2 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108221058A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 许朋阳;徐凤丹;段广有;闵文波;夏步高;葛毅 | 申请(专利权)人: | 苏州金唯智生物科技有限公司 |
主分类号: | C40B40/06 | 分类号: | C40B40/06;C40B50/06;C12N15/113 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 巩克栋 |
地址: | 215123 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文库 全基因组 构建 基因设计 种猪 应用 设计标准 优化模块 靶序列 基因 过滤 筛选 分析 研究 | ||
1.一种猪全基因组sgRNA文库,其特征在于,所述文库包括猪(Sus scrofus)全基因组中的20438个基因的sgRNA;
所述sgRNA的获取过程为:首先在靶序列上获取候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤。
2.根据权利要求1所述的sgRNA文库,其特征在于,所述候选sgRNA的筛选标准包括20%-80%的GC含量;
优选地,所述候选sgRNA的筛选标准包括40%-70%的GC含量;
优选地,所述候选sgRNA的筛选标准还包括19-21nt的长度。
3.根据权利要求1或2所述的sgRNA文库,其特征在于,所述sgRNA的过滤标准包括选择靠近5’端的sgRNA;
优选地,所述sgRNA的过滤标准包括每个CDS片段的sgRNA数量不超过2条。
4.一种如权利要求1-3中任一项所述的猪全基因组sgRNA文库用于构建基于敲除突变体文库和/或基于敲除动物模型。
5.一种猪全基因组sgRNA文库的构建方法,其特征在于,包括如下步骤:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
(2)sgRNA设计:根据GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定允许的错配数进行脱靶率评估并分级;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA和每个CDS片段的sgRNA数量不超过2条。
6.根据权利要求5所述的方法,其特征在于,步骤(1)所述靶序列的选择标准包括蛋白质编码基因选择CDS区域作为靶序列;
优选地,步骤(2)所述筛选依据还包括PAM序列和单双链模式。
7.根据权利要求5或6所述的方法,其特征在于,步骤(2)所述允许的错配数为0-5个,优选为5个;
优选地,步骤(2)所述sgRNA设计的脱靶率评估标准为:
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高。
8.根据权利要求4-7中任一项所述的方法,其特征在于,步骤(2)所述分级的级别包括:最优、低风险、风险适中和高风险四个级别。
9.根据权利要求5-8中任一项所述的方法,其特征在于,步骤(3)所述筛选的标准还包括:每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%中的任意一种或至少两种的组合,优选为每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合。
10.根据权利要求5-9中任一项所述的方法,其特征在于,具体包括如下步骤:
(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;
其中,蛋白质编码基因选择CDS区域作为靶序列;
(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对并根据指定0-5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;
其中,脱靶率评估的标准为
1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;
2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;
3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;
(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州金唯智生物科技有限公司,未经苏州金唯智生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711490244.2/1.html,转载请声明来源钻瓜专利网。