[发明专利]一种染色体变异检测方法、装置、电子设备及介质有效
申请号: | 202110620219.1 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113192557B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 陈河兵;杨骞;李昊;伯晓晨 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00;G16B40/00 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 田云 |
地址: | 100850 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 染色体 变异 检测 方法 装置 电子设备 介质 | ||
本申请提供了一种染色体变异检测方法、装置、电子设备及介质,该方法包括:获取待检测染色体的初始测序数据;根据所述初始测序数据的分辨率,构造所述初始测序数据的特征谱;根据所述初始测序数据的特征谱,统计各个待检测染色体的第一离群量和第一特征向量;从所述待检测染色体中,选择第一离群量大于第一预设阈值的染色体,并确定为发生变异染色体;根据所述发生变异染色体对应的第一特征向量,确定所述发生变异染色体的变异位置;本申请使用的仅仅是初始测序数据的全局信息和背景信息区分异常点,能更准确去除数据噪声和其他生物学信号的影响,假阳性低;使用简便,无需大量标注良好的训练数据集。
技术领域
本申请涉及染色体变异技术领域,具体而言,涉及一种染色体变异检测方法、装置、电子设备及介质。
背景技术
染色体结构变异(SV)是染色体变异的一种,是内因和外因共同作用的结果,外因有各种射线、化学药剂、温度的剧变等,内因有生物体内代谢过程的失调、衰老等。染色体结构变异是癌症细胞基因组的显著特征。
现有技术中,常采用HiCtrans方法和HiNT方法来鉴定癌细胞中染色体间易位的断点位置,并将染色体间Hi-C(High-throughput/resolution chromosome conformationcapture)矩阵的行、列和向量发生变化的位置作为染色体间易位的断点位置。但现有检测方法在识别处于染色体断点位置时,识别的准确率较低。
发明内容
有鉴于此,本申请的目的在于提供一种染色体变异检测方法、装置、电子设备及介质,仅使用初始测序数据即可准确确定染色体变异位点。
第一方面,本申请实施例提供了一种染色体变异检测方法,所述方法包括:
获取待检测染色体的初始测序数据;
根据所述初始测序数据的分辨率,构造所述初始测序数据的特征谱;其中,所述特征谱表征了所述初始测序数据对应的不同强度信号的分布情况;
根据所述初始测序数据的特征谱,统计各个待检测染色体的第一离群量和第一特征向量;
从所述待检测染色体中,选择第一离群量大于第一预设阈值的染色体,并确定为发生变异染色体;
根据所述发生变异染色体对应的第一特征向量,确定所述发生变异染色体的变异位置。
在本申请较佳的技术方案中,上述根据所述初始测序数据的分辨率,构造所述初始测序数据的特征谱,包括:
基于初始测序数据中每一个序列数据的不同分辨率,将所述初始测序数据转化为多个表征染色体片段间的交互频率的测序互作矩阵;
计算每个所述测序互作矩阵的特征值;
根据多个测序互作矩阵分别对应的特征值,构造所述初始测序数据的特征谱。
在本申请较佳的技术方案中,上述根据所述初始测序数据的特征谱,统计各个待检测染色体的第一离群量,包括:
计算所述特征谱的直方统计区间;
根据所述直方统计区间,统计各个待检测染色体的第一离群量。
在本申请较佳的技术方案中,上述根据所述初始测序数据的特征谱,统计各个待检测染色体的第一特征向量,包括:
构建第一离群量中各个离群值的第二特征向量;
基于所述第二特征向量,按照各个待检测染色体分辨率位置取平均值,确定为所述各个待检测染色体的第一特征向量。
在本申请较佳的技术方案中,上述第一预设阈值通过如下方式确定,包括:
获取待检测染色体的参考测序数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110620219.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有顶部档板的房车
- 下一篇:一种HEV电机零偏标定方法及系统