[发明专利]一种基于深度学习的相似病历查找方法与系统有效
申请号: | 202010412253.5 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111613339B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 崔立真;姜涛;鹿旭东;郭伟 | 申请(专利权)人: | 山东大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F16/36;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 相似 病历 查找 方法 系统 | ||
1.一种基于深度学习的相似病历查找方法,其特征在于,包括:
构建能够表示医学概念之间关系的知识图谱;
对获取的病历样本信息进行预处理后,提取病历样本信息的主题作为病历的特征信息,并存储至数据库;
对于输入的电子病历信息,提取病历特征信息;在所述知识图谱中获取包含与该电子病历相关的医疗常识的子图向量;
将当前病历的特征信息、子图向量和病历信息样本数据库中病历的特征信息输入到训练好的神经网络模型中,计算当前病历和数据库中每个病历的相似度;按照相似度的大小,输出设定数量的相似病例;
所述神经网络模型的训练过程,包括:
调取数据库中的两个病历样本的特征信息,分别在知识图谱数据库中匹配相应的子图;
将获取到的子图输入到图形注意力模型中,图形注意力模型获取病历主题在图中的特征,并将该子图映射到一个子图向量中,所述向量包含电子病历相关的医疗常识;
将两个病历样本的特征信息以及对应的子图向量分别输入到神经网络模型,所述神经网络模型使用共享权重的孪生神经网络去计算两个病历样本信息的相似度;
重复上述过程,优化所述神经网络模型的参数,得到训练好的用于判断两个病历信息是否相似的神经网络模型。
2.如权利要求1所述的一种基于深度学习的相似病历查找方法,其特征在于,构建医疗领域的知识图谱,所述知识图谱中的实体表示医学概念,知识图谱中的边表示医学概念之间的关系。
3.如权利要求1所述的一种基于深度学习的相似病历查找方法,其特征在于,在构建医疗领域的知识图谱之后,还包括:
训练BERT+CRF模型,使得所述模型能够识别医学文本中的实体和关系;
使用所述模型预测没有标注的医疗文本数据集,识别出医疗文本中的医学概念和医学概念之间的关系;
人工去除噪音数据,将最终得到的知识图谱存储到数据库。
4.如权利要求1所述的一种基于深度学习的相似病历查找方法,其特征在于,所述病历信息至少包括:病人姓名,住院时间、电子病历和医疗诊断结果;根据病人的姓名构建唯一的ID标识。
5.如权利要求1所述的一种基于深度学习的相似病历查找方法,其特征在于,对获取到的病历信息进行预处理,包括:删除信息不完整的病历信息、去除停用词以及分词处理。
6.如权利要求1所述的一种基于深度学习的相似病历查找方法,其特征在于,提取病历信息的主题作为病历的特征信息,具体为:
使用训练后的文本主题模型得到主题的词分布概率,根据每个主题的词分布判断每个主题的实际含义;
通过上述的文本主题模型得到每个病历文本中每个词的主题分布;
根据主题分布选取每个病历文本的主题,作为病历的特征信息。
7.一种基于深度学习的相似病历查找系统,其特征在于,包括:
用于构建能够表示医学概念之间关系的知识图谱的装置;
用于对获取的病历样本信息进行预处理后,提取病历样本信息的主题作为病历的特征信息,并存储至数据库的装置;
用于对于输入的电子病历信息,提取病历特征信息;在所述知识图谱中获取包含与该电子病历相关的医疗常识的子图向量的装置;
用于将当前病历的特征信息、子图向量和病历信息样本数据库中病历的特征信息输入到训练好的神经网络模型中,计算当前病历和数据库中每个病历的相似度;按照相似度的大小,输出设定数量的相似病例的装置;
所述神经网络模型的训练过程,包括:
调取数据库中的两个病历样本的特征信息,分别在知识图谱数据库中匹配相应的子图;
将获取到的子图输入到图形注意力模型中,图形注意力模型获取病历主题在图中的特征,并将该子图映射到一个子图向量中,所述向量包含电子病历相关的医疗常识;
将两个病历样本的特征信息以及对应的子图向量分别输入到神经网络模型,所述神经网络模型使用共享权重的孪生神经网络去计算两个病历样本信息的相似度;
重复上述过程,优化所述神经网络模型的参数,得到训练好的用于判断两个病历信息是否相似的神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010412253.5/1.html,转载请声明来源钻瓜专利网。