[发明专利]一种猪全基因组sgRNA文库及其构建方法和应用在审

专利信息
申请号: 201711490244.2 申请日: 2017-12-29
公开(公告)号: CN108221058A 公开(公告)日: 2018-06-29
发明(设计)人: 许朋阳;徐凤丹;段广有;闵文波;夏步高;葛毅 申请(专利权)人: 苏州金唯智生物科技有限公司
主分类号: C40B40/06 分类号: C40B40/06;C40B50/06;C12N15/113
代理公司: 北京品源专利代理有限公司 11332 代理人: 巩克栋
地址: 215123 江苏省苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文库 全基因组 构建 基因设计 种猪 应用 设计标准 优化模块 靶序列 基因 过滤 筛选 分析 研究
【权利要求书】:

1.一种猪全基因组sgRNA文库,其特征在于,所述文库包括猪(Sus scrofus)全基因组中的20438个基因的sgRNA;

所述sgRNA的获取过程为:首先在靶序列上获取候选sgRNA,然后对候选sgRNA进行脱靶分析并打分,最后根据打分结果对sgRNA过滤。

2.根据权利要求1所述的sgRNA文库,其特征在于,所述候选sgRNA的筛选标准包括20%-80%的GC含量;

优选地,所述候选sgRNA的筛选标准包括40%-70%的GC含量;

优选地,所述候选sgRNA的筛选标准还包括19-21nt的长度。

3.根据权利要求1或2所述的sgRNA文库,其特征在于,所述sgRNA的过滤标准包括选择靠近5’端的sgRNA;

优选地,所述sgRNA的过滤标准包括每个CDS片段的sgRNA数量不超过2条。

4.一种如权利要求1-3中任一项所述的猪全基因组sgRNA文库用于构建基于敲除突变体文库和/或基于敲除动物模型。

5.一种猪全基因组sgRNA文库的构建方法,其特征在于,包括如下步骤:

(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;

(2)sgRNA设计:根据GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对,并根据指定允许的错配数进行脱靶率评估并分级;

(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA和每个CDS片段的sgRNA数量不超过2条。

6.根据权利要求5所述的方法,其特征在于,步骤(1)所述靶序列的选择标准包括蛋白质编码基因选择CDS区域作为靶序列;

优选地,步骤(2)所述筛选依据还包括PAM序列和单双链模式。

7.根据权利要求5或6所述的方法,其特征在于,步骤(2)所述允许的错配数为0-5个,优选为5个;

优选地,步骤(2)所述sgRNA设计的脱靶率评估标准为:

1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;

2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;

3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高。

8.根据权利要求4-7中任一项所述的方法,其特征在于,步骤(2)所述分级的级别包括:最优、低风险、风险适中和高风险四个级别。

9.根据权利要求5-8中任一项所述的方法,其特征在于,步骤(3)所述筛选的标准还包括:每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%中的任意一种或至少两种的组合,优选为每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置、GC含量在20%-80%的组合。

10.根据权利要求5-9中任一项所述的方法,其特征在于,具体包括如下步骤:

(1)靶序列选择:从数据库中下载基因组序列和注释文件,选取具有5’-20nt+NGG-3’的序列特征的位点并移除跨越外显子区域的序列作为输入靶序列;

其中,蛋白质编码基因选择CDS区域作为靶序列;

(2)sgRNA设计:根据PAM序列、单双链模式、GC含量为20%-80%和长度为19-21nt筛选候选sgRNA,并进行全基因组序列比对并根据指定0-5个的错配数进行脱靶率评估并分为最优、低风险、风险适中和高风险四个级别;

其中,脱靶率评估的标准为

1)将能够精确比对到基因组中多个位点的sgRNA过滤掉;

2)只比对到基因组中该sgRNA对应位置的sgRNA为Best;

3)对于其他的sgRNA根据错配位置从5’->3’罚分逐渐递减,再结合错配数进行综合打分,罚分越高风险越高;

(3)sgRNA过滤:将评估并分级后的sgRNA根据以下标准进行筛选:选择靠近5’端的sgRNA、每个CDS片段的sgRNA数量不超过2条、每个靶序列选择不大于6条的sgRNA、只保留级别为最优和低风险的sgRNA、确保选择的sgRNA尽可能覆盖基因的不同转录本、每个基因的多个sgRNA尽量靶定到基因的不同位置和GC含量在20%-80%。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州金唯智生物科技有限公司,未经苏州金唯智生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711490244.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top