[发明专利]一种微生物识别方法及系统在审
| 申请号: | 201610237920.4 | 申请日: | 2016-04-15 |
| 公开(公告)号: | CN107301329A | 公开(公告)日: | 2017-10-27 |
| 发明(设计)人: | 王俊宁 | 申请(专利权)人: | 泽塔生物科技(上海)有限公司 |
| 主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/24;G06F19/28 |
| 代理公司: | 上海骁象知识产权代理有限公司31315 | 代理人: | 赵俊寅 |
| 地址: | 201203 上海市浦东*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 微生物 识别 方法 系统 | ||
1.一种微生物识别方法,其特征在于,包括以下步骤:
步骤一,输入待检测微生物的全基因组序列;
步骤二,计算上述全基因序列的特征向量,将上述特征向量与数据库中预存的特征向量进行距离计算和排序定位,搜索并收敛至记录数少于等于预设数量为止;
步骤三,对搜索得到的一组同输入序列距离最近的记录,进行平均核酸匹配度指标ANI/isDDH和序列比对长度比例的计算,用于判断该待测微生物的属种或亚种。
2.如权利要求1所述的一种微生物识别方法,其特征在于,所述步骤二中的序列特征为基因组DNA的k-mer频数。
3.如权利要求2所述的一种微生物识别方法,其特征在于,所述步骤二中的距离为空间距离。
4.如权利要求3所述的一种微生物识别方法,其特征在于,所述步骤二还包括以下步骤:
根据输入特征向量同预存特征向量计算距离迭代缩小搜索,收敛至距离最小的若干记录;
搜索过程中使用不同的k值同预存或实时计算的向量进行距离计算;k-mer频数根据需要进行均一化处理。
5.一种微生物识别系统,其特征在于,包括输入装置、计算装置、比较装置、输出装置和数据库,所述输入装置用于录入数据,所述计算装置用于计算数值、搜索和排序定位,所述比较装置用于比较计算值与预设值之间的大小关系,所述输出装置用于输出结果,所述数据库用于存储数据。
6.如权利要求5所述的一种微生物识别系统,其特征在于,所述数据库设有基因组序列子数据库。
7.如权利要求5所述的一种微生物识别系统,其特征在于,所述数据库设有基因组序列衍生结构注释和功能注释信息子数据库。
8.如权利要求5所述的一种微生物识别系统,其特征在于,所述数据库设有基因组元信息子数据库。
9.如权利要求5所述的一种微生物识别系统,其特征在于,所述数据库设有基因组序列衍生特征子数据库。
10.如权利要求6所述的一种微生物识别系统,其特征在于,所述基因组序列子数据库用于保存单个微生物分离株的全基因组序列拼装。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泽塔生物科技(上海)有限公司,未经泽塔生物科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610237920.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





