[发明专利]根据基因突变信息对样本分类的方法、装置、设备及介质在审
| 申请号: | 201910061006.2 | 申请日: | 2019-01-23 |
| 公开(公告)号: | CN109411018A | 公开(公告)日: | 2019-03-01 |
| 发明(设计)人: | 高军晖;王丽君;袁卫兰;张英霞;龚建兵;赵伟;林灵 | 申请(专利权)人: | 上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司 |
| 主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B40/20 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 突变基因 集合 样本分类 分类 基因突变 样本 分类准确性 关联基因 样本类别 合并 基因 优化 | ||
本发明实施例公开了一种根据基因突变信息对样本分类的方法、装置、设备及介质,所述方法包括:获取与至少两个待分类的样本分别对应的突变基因集合,并根据基因间关系图对各所述突变基因集合进行关联基因的扩充;将扩充后的各所述突变基因集合进行合并,并将合并结果划分为与至少两个样本类别分别对应的突变基因分类集合;采用所述突变基因分类集合,对各所述样本进行分类。本发明实施例的技术方案能够优化现有的基于突变基因的样本分类方式,从而提高分类准确性。
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种根据基因突变信息对样本分类的方法、装置、设备及介质。
背景技术
基因突变是指基因组DNA(脱氧核糖核酸)分子发生的突然的、可遗传的变异现象。基因在复制过程中发生错误,或者受物理的、化学的或生物的因素影响下,导致基因序列发生改变,这种基因序列改变有多种形式,比如点突变(单个碱基缺失)、多个碱基的缺失、重复或插入等。
基因突变往往会与某些疾病(例如,肿瘤)直接或者间接相关。现有技术中,可以针对不同样本的突变的基因类型,对样本,特别是患病用户的样本进行分类。目前,基于突变的基因进行样本分类的方式主要是,将样本的每个基因作为一个特征,并将每个样本的全部突变基因构成特征向量,进而通过对各个样本特征向量的聚类处理,对各个样本进行简单、直观的分类。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:现有的样本分类技术没有充分考虑基因间的复杂关系,分类方式缺乏生物学意义,分类效果差。
发明内容
本发明提供一种根据基因突变信息对样本分类的方法、装置、设备及介质,以优化现有的基于突变基因的样本分类方式,提高分类准确性。
第一方面,本发明实施例提供了一种根据基因突变信息对样本分类的方法,包括:
获取与至少两个待分类的样本分别对应的突变基因集合,并根据基因间关系图对各所述突变基因集合进行关联基因的扩充;
将扩充后的各所述突变基因集合进行合并,并将合并结果划分为与至少两个样本类别分别对应的突变基因分类集合;
采用所述突变基因分类集合,对各所述样本进行分类。
第二方面,本发明实施例还提供了一种根据基因突变信息对样本分类的装置,包括:
关联基因扩充模块,用于获取与至少两个待分类的样本分别对应的突变基因集合,并根据基因间关系图对各所述突变基因集合进行关联基因的扩充;
突变基因分类集合划分模块,用于将扩充后的各所述突变基因集合进行合并,并将合并结果划分为与至少两个样本类别分别对应的突变基因分类集合;
样本分类模块,用于采用所述突变基因分类集合,对各所述样本进行分类。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的根据基因突变信息对样本分类的方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的根据基因突变信息对样本分类的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司,未经上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910061006.2/2.html,转载请声明来源钻瓜专利网。





