[发明专利]确定临床描述信息的表型信息的方法、设备和介质有效
申请号: | 202110268457.0 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112687328B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 刘蒙蒙;钟韵山;张钰 | 申请(专利权)人: | 北京贝瑞和康生物技术有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B50/00;G06F40/117;G06F40/126;G06F40/194;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 102299 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 临床 描述 信息 表型 方法 设备 介质 | ||
本公开涉及一种用于确定临床描述信息的表型信息的方法、计算设备和存储介质。该方法包括:获取临床描述信息;将临床描述信息中的每一句话分割成字或标点,以便转换成对应的输入标识;经由第一神经网络模型的第一网络层,将输入标识转换为第一特征向量,第一神经网络模型包括由第一语言模型所构建的第一网络层、由第二语言模型所构建的第二网络层、以及第三网络层;经由第二网络层,生成第二特征向量,第二特征向量用于指示临床描述信息中的每一句话中每一个字与周围字组成的短语是否属于预定关键词集合;经由第三网络层,确定临床描述信息的表型关键词。本公开能够实现自动、快速、准确地确定临床描述信息的表型信息。
技术领域
本公开总体上涉及生物信息处理,并且具体地,涉及用于确定临床描述信息的表型信息的方法、计算设备和计算机存储介质。
背景技术
表型信息例如包括:临床描述信息的特征描述和关联基因信息,临床描述信息的特征描述例如为表型关键词。表型信息对临床诊断策略的确定具有重要的参考意义,例如,在基因检测之前,表型关键词可以辅助确定要研究的区域,帮助筛选检验项目。在基因检测之后,表型关键词例如可以和关联基因信息可以关联起来以用于针对临床描述信息进行解释。因此,临床描述信息的表型信息(例如包括:表型关键词和关联基因信息)的准确确定变得尤为重要。
传统的确定临床描述信息的表型信息的方案大多依赖于人工的干预,例如,需要人工解读电子病历中的临床描述信息的表型关键词,以及需要人工匹配与临床描述信息相关联的关联基因,缺乏关于确定临床描述信息的表型信息的自动化流程解决方案,进而使得临床描述信息的表型信息的确定过程效率低下。另外,上述人工干预步骤会因为不同人针对同一段临床描述信息存在主观性偏差和描述格式的不确定性而导致临床描述信息的表型信息杂乱而缺乏通用性,而且容易产生错误。因此,传统的确定临床描述信息的表型信息的方案需要耗费较多时间、效率低下,并且容易产生错误。
综上,确定临床描述信息的表型信息的方案存在的不足之处在于:无法实现确定临床描述信息的表型信息的自动化,并且确定过程效率低下、缺乏通用性、且容易产生错误。
发明内容
本公开提供一种用于确定临床描述信息的表型信息的方法、计算设备和计算机存储介质,能够实现自动、快速、准确地确定临床描述信息的表型信息。
根据本公开的第一方面,提供了一种用于确定临床描述信息的表型信息的方法。该方法包括:获取临床描述信息;将临床描述信息中的每一句话分割成字或标点,以便将经分割的字或标点转换成对应的输入标识;经由第一神经网络模型的第一网络层,将输入标识转换为第一特征向量,第一神经网络模型包括由第一语言模型所构建的第一网络层、由第二语言模型所构建的第二网络层、以及第三网络层;经由第二网络层,生成第二特征向量,第二特征向量用于指示临床描述信息中的每一句话中每一个字与周围字组成的短语是否属于预定关键词集合;以及基于第一特征向量和第二特征向量,经由第三网络层,确定临床描述信息的表型关键词。
根据本发明的第二方面,还提供了一种计算设备,该设备包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得计算设备执行本公开的第一方面的方法。
根据本公开的第三方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被机器执行时实现根据本公开的第一方面的方法。
在一些实施例中,第一语言模型为基于转换器的双向编码表征(BERT)模型,第二语言模型为N元语法(N-gram)模型,第三网络层是基于条件随机场模型而构建的。
在一些实施例中,用于确定临床描述信息的表型信息的方法还包括:基于所确定的表型关键词,针对候选基因进行排序,以便生成关于候选基因的排序信息;以及基于候选基因的排序信息,确定与临床描述信息的表型相关联的基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京贝瑞和康生物技术有限公司,未经北京贝瑞和康生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268457.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置