[发明专利]一种医疗数据处理方法、装置、设备及存储介质有效
申请号: | 202010592658.1 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111785340B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 郭佳昌;陈俊;代小亚;黄海峰;陆超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G16H10/20 | 分类号: | G16H10/20;G16H50/20;G16H50/70;G06N3/045;G06N3/084;G06F18/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 数据处理 方法 装置 设备 存储 介质 | ||
1.一种医疗数据处理方法,包括:
对医疗数据进行特征字段提取,并根据所提取的至少一个特征字段的特征值,生成医疗项数据;
通过第一神经网络对所述医疗数据和医疗项数据进行特征提取,得到医疗特征向量;以及,通过第二神经网络对所述医疗数据关联的诊断数据进行特征提取,得到诊断特征向量;
确定所述医疗特征向量和所述诊断特征向量的相关性;
其中,所述第一神经网络包括第一表示模块、第二表示模块和特征融合模块;
所述第一表示模块,用于对所述医疗数据进行特征提取,得到第一医疗特征向量;
所述第二表示模块,用于对所述医疗项数据进行特征提取,得到第二医疗特征向量;
所述特征融合模块,用于对所述第一医疗特征向量和所述第二医疗特征向量进行特征融合,得到所述医疗特征向量;
其中,所述第二神经网络包括第三表示模块和诊断嵌入模块;
所述第三表示模块,用于对所述诊断数据进行特征提取,得到初始诊断特征向量;
所述诊断嵌入模块,用于对初始诊断特征向量进行编码处理,得到所述诊断特征向量;
其中,所述第一神经网络和所述第二神经网络结构不同,且共同训练得到。
2.根据权利要求1所述的方法,其中,在对所述第一神经网络和所述第二神经网络的训练阶段,所述方法还包括:
分别确定样本患者的样本医疗数据和样本诊断数据的患病区域;
若所述样本诊断数据的患病区域包含于所述样本医疗数据的患病区域,则确定所述样本医疗数据和所述样本诊断数据所组成的训练样本对为正样本;否则,确定所述样本医疗数据和所述样本诊断数据所组成的训练样本对为负样本。
3.根据权利要求2所述的方法,其中,所述患病区域包括患病部位和/或患病部位所属人体系统。
4.根据权利要求1所述的方法,其中,在对所述第一神经网络和所述第二神经网络的训练阶段,所述方法还包括:
提取样本患者的样本医疗数据中的记录症状;
将所述记录症状、所述样本患者的样本诊断数据的诊断症状、以及预设症状库,输入至训练好的机器学习模型,得到所述记录症状与所述诊断症状之间的相关性;
若症状相关,则确定所述样本医疗数据和所述样本诊断数据所组成的训练样本对为正样本;否则,确定所述样本医疗数据和所述样本诊断数据所组成的训练样本对为负样本。
5.根据权利要求1所述的方法,其中,根据所提取的至少一个特征字段的特征值,生成医疗项数据,包括:
根据所提取的至少一个特征字段的特征值,生成初始医疗项数据;
采用注意力机制,对所述初始医疗项数据中相同属性特征字段下的各特征值分别进行加权,得到所述医疗项数据。
6.根据权利要求1-5任一项所述的方法,其中,所述医疗数据包括文本描述的主诉和现病史中的至少一种;所述医疗项数据包括临床表现和既往病史中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010592658.1/1.html,转载请声明来源钻瓜专利网。