[发明专利]用于确定致病风险变异位点的方法、设备和存储介质有效
申请号: | 202110268390.0 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112687332B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 钟韵山;刘蒙蒙;张钰;穆婷;李云双 | 申请(专利权)人: | 北京贝瑞和康生物技术有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/20;G16B40/30;G16B50/10;G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 102299 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 致病 风险 变异 方法 设备 存储 介质 | ||
1.一种用于确定致病风险变异位点的方法,包括:
获取待测对象的样本的全外显子测序序列比对结果信息和关于所述待测对象的临床描述信息;
基于所述全外显子测序序列比对结果信息,确定变异位点,以便针对变异位点进行注释以生成关于变异位点的注释信息,所述关于变异位点的注释信息至少包括:基因功能注释信息、基因相关疾病信息;
经由经训练的第一神经网络模型,提取所述临床描述信息中的表型关键词,所述第一神经网络模型包括由BERT模型所构建的第一网络层、由N-gram模型所构建的第二网络层、以及基于条件随机场模型而构建的第三网络层;
基于所提取的表型关键词,针对候选基因进行排序,以便生成关于候选基因的排序信息,所述候选基因与所述临床描述信息相关联;
基于关于变异位点的注释信息,过滤所述变异位点;
基于经过滤而留下的变异位点的注释信息和关于候选基因的排序信息,生成用于输入经训练的预定模型的输入数据;以及
基于所述经训练的预定模型,提取所述输入数据的特征,以便确定关于待测对象的致病风险变异位点,
其中经由经训练的第一神经网络模型提取所述临床描述信息中的表型关键词包括:
将所述临床描述信息中的每一句话分割成字或标点,以便将经分割的字或标点转换成对应的输入标识;
基于所述第一网络层,将每一个对应的输入标识转换为多维的第一特征向量;
基于所述第二网络层和预定关键词集合,生成第二特征向量,所述第二特征向量用于指示每一个字与周围字组成的短语是否属于预定关键词集合;以及
基于所述第一特征向量和所述第二特征向量,经由所述第三网络层,确定所述临床描述信息中的表型关键词。
2.根据权利要求1所述的方法,其中确定所述临床描述信息中的表型关键词包括:
融合所述第一特征向量和所述第二特征向量,以生成融合后特征向量;
经由所述第三网络层,提取融合后特征向量的特征,以预测关于每一个字符的类别;以及
基于所预测的每一个字符的类别,确定所述临床描述信息中的表型关键词。
3.根据权利要求2所述的方法,其中经由所述第三网络层提取融合后特征向量的特征以预测关于每一个字符的类别包括:
经由全连接网络层,针对融合后特征向量进行降维,使得降维后的特征向量的维度和标签的类别数目相一致;
将降维后的特征向量输入至所述第三网络层中,以便计算每个降维后的特征向量的对数似然值;
针对所计算的对数似然值取负平均,以作为所述第一神经网络模型的损失值;以及
采用维特比算法进行解码,以便预测关于每一个字符的类别。
4.根据权利要求1所述的方法,其中基于所提取的表型关键词针对候选基因进行排序以便生成关于候选基因的排序信息包括:
确认候选基因和对应综合征;
提取每一个对应综合征的表型;
经由第二神经网络模型,计算所述临床描述信息中的表型关键词与对应综合征的表型的相似度,所述第二神经网络模型是基于由BERT模型所形成的孪生神经网络而构建的;以及
基于所计算的相似度,针对候选基因进行排序,以便生成关于候选基因的排序信息。
5.根据权利要求4所述的方法,其中经由第二神经网络模型计算所述临床描述信息中的表型关键词与对应综合征的表型的相似度包括:
针对临床描述信息中的表型关键词和对应综合征的表型分别进行预处理,以便生成第一表型输入标识和第二表型输入标识;
将第一表型输入标识和第二表型输入标识编码为第三特征向量和第四特征向量,以用于输入第二神经网络模型;
将所述临床描述信息中的表型关键词中所有的字符所对应的第三特征向量取平均值,以便得到所述临床描述信息中的表型关键词的第一对应编码;
将对应综合征的表型中所有的字符所对应的第四特征向量取平均值,以便得到对应综合征的表型的第二对应编码;以及
计算所述第一对应编码和第二对应编码的夹角的余弦,以便确定所述临床描述信息中的表型关键词与对应综合征的表型相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京贝瑞和康生物技术有限公司,未经北京贝瑞和康生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268390.0/1.html,转载请声明来源钻瓜专利网。