[发明专利]确定临床描述信息的表型信息的方法、设备和介质有效

专利信息
申请号: 202110268457.0 申请日: 2021-03-12
公开(公告)号: CN112687328B 公开(公告)日: 2021-08-31
发明(设计)人: 刘蒙蒙;钟韵山;张钰 申请(专利权)人: 北京贝瑞和康生物技术有限公司
主分类号: G16B20/00 分类号: G16B20/00;G16B50/00;G06F40/117;G06F40/126;G06F40/194;G06F40/295;G06N3/04;G06N3/08
代理公司: 北京市金杜律师事务所 11256 代理人: 黄倩
地址: 102299 北京市昌平区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 确定 临床 描述 信息 表型 方法 设备 介质
【权利要求书】:

1.一种用于确定临床描述信息的表型信息的方法,包括:

获取临床描述信息;

将所述临床描述信息中的每一句话分割成字或标点,以便将经分割的字或标点转换成对应的输入标识;

经由第一神经网络模型的第一网络层,将所述输入标识转换为第一特征向量,所述第一神经网络模型包括由第一语言模型所构建的所述第一网络层、由第二语言模型所构建的第二网络层、以及第三网络层;

经由所述第二网络层,生成第二特征向量,所述第二特征向量用于指示所述临床描述信息中的每一句话中每一个字与周围字组成的短语是否属于预定关键词集合;以及

基于所述第一特征向量和所述第二特征向量,经由所述第三网络层,确定所述临床描述信息的表型关键词;

基于所确定的表型关键词,针对候选基因进行排序,以便生成关于候选基因的排序信息;以及

基于候选基因的排序信息,确定与临床描述信息的表型相关联的基因;

其中基于所确定的表型关键词,针对候选基因进行排序以便生成关于候选基因的排序信息包括:

确认候选基因和对应综合征;

提取每一个对应综合征的表型;

经由第二神经网络模型,计算所述临床描述信息的表型关键词与对应综合征的表型的相似度;以及

基于所计算的相似度,针对候选基因进行排序,以便生成关于候选基因的排序信息。

2.根据权利要求1所述的方法,其中所述第一语言模型为基于转换器的双向编码表征模型,所述第二语言模型为N元语法模型,所述第三网络层是基于条件随机场模型而构建的。

3.根据权利要求1所述的方法,其中所述第二神经网络模型是基于由双向编码表征模型所形成的孪生神经网络而构建的。

4.根据权利要求1所述的方法,其中所述第二神经网络模型包括第一池化层、第二池化层、相似度计算网络层、以及由双向编码表征模型所分别构建的第一双向编码表征网络层和第二双向编码表征网络层。

5.根据权利要求4所述的方法,其中经由第二神经网络模型计算所述临床描述信息的表型关键词与对应综合征的表型的相似度包括:

针对临床描述信息的表型关键词和对应综合征的表型分别进行预处理,以便生成第一表型输入标识和第二表型输入标识;

经由第一双向编码表征网络层,将第一表型输入标识编码为第三特征向量,所述第三特征向量与所述临床描述信息的表型关键词的所有字符相对应;

经由第二双向编码表征网络层,将第二表型输入标识编码为第四特征向量,第四特征向量与所述对应综合征的表型的所有字符相对应;

经由第一池化层,基于第三特征向量,生成第一对应编码;

经由第二池化层,基于第四特征向量,生成第二对应编码;以及

经由相似度计算网络层,计算所述第一对应编码和所述第二对应编码的夹角的余弦,以便得到所述临床描述信息的表型关键词与对应综合征的表型之间的相似度。

6.根据权利要求1所述的方法,其中所述第二神经网络模型的训练方法包括:

针对预定标准术语集合中的多个标准术语,计算标准术语之间的相似度,以用于针对所述第二神经网络模型进行非监督训练;以及

针对相关联的口语描述和标准术语,计算口语描述和标准术语之间的相似度,以用于针对所述第二神经网络模型进行监督训练。

7.根据权利要求6所述的方法,其中针对所述第二神经网络模型进行非监督训练包括:

将预定标准术语集合按照各个标准术语之间的相似度,映射到多维空间中;以及

随机抽取两个标准术语,以便计算出两个标准术语之间的相似度,以用于将所计算的两个标准术语之间的相似度作为训练目标值而对所述第二神经网络模型进行训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京贝瑞和康生物技术有限公司,未经北京贝瑞和康生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110268457.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top