[发明专利]确定临床描述信息的表型信息的方法、设备和介质有效
| 申请号: | 202110268457.0 | 申请日: | 2021-03-12 |
| 公开(公告)号: | CN112687328B | 公开(公告)日: | 2021-08-31 |
| 发明(设计)人: | 刘蒙蒙;钟韵山;张钰 | 申请(专利权)人: | 北京贝瑞和康生物技术有限公司 |
| 主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B50/00;G06F40/117;G06F40/126;G06F40/194;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
| 地址: | 102299 北京市昌平区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 确定 临床 描述 信息 表型 方法 设备 介质 | ||
1.一种用于确定临床描述信息的表型信息的方法,包括:
获取临床描述信息;
将所述临床描述信息中的每一句话分割成字或标点,以便将经分割的字或标点转换成对应的输入标识;
经由第一神经网络模型的第一网络层,将所述输入标识转换为第一特征向量,所述第一神经网络模型包括由第一语言模型所构建的所述第一网络层、由第二语言模型所构建的第二网络层、以及第三网络层;
经由所述第二网络层,生成第二特征向量,所述第二特征向量用于指示所述临床描述信息中的每一句话中每一个字与周围字组成的短语是否属于预定关键词集合;以及
基于所述第一特征向量和所述第二特征向量,经由所述第三网络层,确定所述临床描述信息的表型关键词;
基于所确定的表型关键词,针对候选基因进行排序,以便生成关于候选基因的排序信息;以及
基于候选基因的排序信息,确定与临床描述信息的表型相关联的基因;
其中基于所确定的表型关键词,针对候选基因进行排序以便生成关于候选基因的排序信息包括:
确认候选基因和对应综合征;
提取每一个对应综合征的表型;
经由第二神经网络模型,计算所述临床描述信息的表型关键词与对应综合征的表型的相似度;以及
基于所计算的相似度,针对候选基因进行排序,以便生成关于候选基因的排序信息。
2.根据权利要求1所述的方法,其中所述第一语言模型为基于转换器的双向编码表征模型,所述第二语言模型为N元语法模型,所述第三网络层是基于条件随机场模型而构建的。
3.根据权利要求1所述的方法,其中所述第二神经网络模型是基于由双向编码表征模型所形成的孪生神经网络而构建的。
4.根据权利要求1所述的方法,其中所述第二神经网络模型包括第一池化层、第二池化层、相似度计算网络层、以及由双向编码表征模型所分别构建的第一双向编码表征网络层和第二双向编码表征网络层。
5.根据权利要求4所述的方法,其中经由第二神经网络模型计算所述临床描述信息的表型关键词与对应综合征的表型的相似度包括:
针对临床描述信息的表型关键词和对应综合征的表型分别进行预处理,以便生成第一表型输入标识和第二表型输入标识;
经由第一双向编码表征网络层,将第一表型输入标识编码为第三特征向量,所述第三特征向量与所述临床描述信息的表型关键词的所有字符相对应;
经由第二双向编码表征网络层,将第二表型输入标识编码为第四特征向量,第四特征向量与所述对应综合征的表型的所有字符相对应;
经由第一池化层,基于第三特征向量,生成第一对应编码;
经由第二池化层,基于第四特征向量,生成第二对应编码;以及
经由相似度计算网络层,计算所述第一对应编码和所述第二对应编码的夹角的余弦,以便得到所述临床描述信息的表型关键词与对应综合征的表型之间的相似度。
6.根据权利要求1所述的方法,其中所述第二神经网络模型的训练方法包括:
针对预定标准术语集合中的多个标准术语,计算标准术语之间的相似度,以用于针对所述第二神经网络模型进行非监督训练;以及
针对相关联的口语描述和标准术语,计算口语描述和标准术语之间的相似度,以用于针对所述第二神经网络模型进行监督训练。
7.根据权利要求6所述的方法,其中针对所述第二神经网络模型进行非监督训练包括:
将预定标准术语集合按照各个标准术语之间的相似度,映射到多维空间中;以及
随机抽取两个标准术语,以便计算出两个标准术语之间的相似度,以用于将所计算的两个标准术语之间的相似度作为训练目标值而对所述第二神经网络模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京贝瑞和康生物技术有限公司,未经北京贝瑞和康生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268457.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





