[发明专利]基于门控循环单元神经网络的冠状病毒序列识别方法有效
申请号: | 202010537286.2 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111785328B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 应晓敏;何振;卢康;胡朔枫 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/00;G16B5/00;G06N3/08 |
代理公司: | 北京智乾知识产权代理事务所(普通合伙) 11552 | 代理人: | 华冰 |
地址: | 100850*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 门控 循环 单元 神经网络 冠状病毒 序列 识别 方法 | ||
本发明涉及基于门控循环单元神经网络的冠状病毒序列识别方法,其包括如下步骤:S1:进行数据收集;S2:对所收集的数据进行预处理,从原始训练样本中进行数据抽取得到训练集、验证集和测试集;建立基于冠状病毒序列的独立测试集;S3:对S2中获得各数据集进行编码,建立训练冠状病毒序列的分类模型;S4:对该模型进行修正;S5:统计该模型对将冠状病毒序列与人的基因组序列合并以后的测试集的每条序列的输出分值;S6:并根据该输出分值的分布情况设置拒识区间,以便减少误差;S7:当输出分值≥拒识区间的上限阈值时,判断序列为冠状病毒序列;当输出分值≤拒识区间的下限阈值时,判断序列为人基因组序列。
技术领域
本发明涉及神经网络、数据处理以及计算机模拟技术领域,更为具体地是涉及一种基于门控循环单元神经网络的冠状病毒序列识别方法。
背景技术
冠状病毒(Coronavirus,CoV)是一类具有包膜的单股正链RNA病毒,该病毒在哺乳动物和鸟类中引起多种疾病。部分冠状病毒在人类中具有很高的传染性、致病性和致死率,对国民健康、社会稳定和国家经济发展有着巨大的负面影响。
实时逆转录聚合酶链式反应(Real-time Reverse-transcription PolymeraseChain Reaction,RT-PCR)扩增方法是检测冠状病毒的首选方法。该方法具有实时监测、敏感度高、特异性高等优点,但也存在一些缺点,例如无法对新型和高变异株冠状病毒进行检测,对引物要求高,需要实验人员掌握相应实验操作技能等。
对新发和高变异株冠状病毒,通常处理为分离出病毒,然后利用电子显微镜在细胞培养物中鉴定病毒。这在技术层面上要求很高,同时耗时长、敏感性低。
而高通量测序数据分析的传统方法是序列比对,尽管已经有不少针对高通量测序序列特点的序列比对算法,但这些序列比对算法具有计算时间长、对计算资源要求高等缺点。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于门控循环单元神经网络的冠状病毒序列识别方法,其从NCBI中获得冠状病毒和人基因组数据。对收集到的序列进行数据预处理,构建冠状病毒感染者样品高通量测序模拟数据集,将其划分为训练集、验证集和测试集,在训练集上训练循环神经网络,在验证集和测试集上测试效果,并收集新型冠状病毒2019-nCoV基因组数据作为独立测试集。该循环神经网络模型能够灵敏、快速地从高通量测序数据中检测出冠状病毒序列,同时具有很好的泛化能力,能够对新发和高变异株冠状病毒序列进行准确地检测,为新发和高变异株冠状病毒的鉴定提供了新思路。
本发明的本质在于提高对冠状病毒识别的准确率,即提高判断的精度,虽然本模型本质是对核酸序列进行分类,但是其结果不是为了获得诊断结果或健康状况,而只是一种获取作为中间结果的信息的方法,其中涉及对信息的处理方法。
根据现有技术中的医学知识和本申请中公开的内容从所获得信息本身不能够直接得出疾病的诊断结果或健康状况,也就是说,其并不能直接用于对疾病的诊断。
具体地,该模型只能对病毒样本测序的结果进行分类,但是测序样品结果的准确性会受到测序实验过程的影响,具有不稳定的因素。即使病毒样本中含有冠状病毒的序列,但是并不代表该病人已经患病,因为人体自身的免疫系统会抵抗病毒的入侵。另外,该模型的结果只能作为一种中间信息,知晓该模型的分类结果并不能直接获得疾病的诊断结果。疾病的诊断需要医生结合病人多方面的表现和结果,比如临床表现和测试化验结果。
本发明的技术方案如下:
一种基于门控循环单元神经网络的冠状病毒序列识别方法,其特征在于,其包括如下步骤:
S1:进行数据收集;所收集的数据包括冠状病毒序列和人的参考基因组序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010537286.2/2.html,转载请声明来源钻瓜专利网。