[发明专利]基于卷积神经网络和主动学习的电子病历分类方法及系统有效
| 申请号: | 201910068242.7 | 申请日: | 2019-01-24 |
| 公开(公告)号: | CN109920501B | 公开(公告)日: | 2021-04-20 |
| 发明(设计)人: | 钱步月;尹畅畅;卫荣;赵荣建;王谞动;刘小彤;陆亮;郑庆华 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/35;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 卷积 神经网络 主动 学习 电子 病历 分类 方法 系统 | ||
1.一种基于卷积神经网络和主动学习的电子病历分类方法,其特征在于,包括以下步骤:
步骤1,获取多个已诊断的电子病历构造样本集合,提取样本集合中的事件实体构建事件实体集合;将获得的事件实体集合中的所有事件实体映射为等维度向量形式,构成实体向量集合,最终获得样本集合中每个电子病历对应的实体向量;
步骤2,从样本集合中随机选择预设批量的电子病历进行标注,构成标注数据集;样本集合中剩余的未标注的电子病历构成未标注数据集;
步骤3,用步骤2获得的标注数据集对应的实体向量对预设卷积神经网络模型进行训练,获得训练后的卷积神经网络模型;
步骤4,用获得的卷积神经网络模型预测未标注数据集中电子病历数据的分类概率,根据预测的分类概率以及卷积神经网络提取到的数据特征,选择符合预设条件的电子病历补入标注数据集;
步骤5,用补入标注数据集的电子病历对应的实体向量,继续对训练后的卷积神经网络模型进行训练,获得再次训练后的卷积神经网络模型;
步骤6,重复步骤4和步骤5,直至模型结果满足预设收敛条件,获得训练好的卷积神经网络模型;
步骤7,将待诊断电子病历对应的实体向量输入步骤6获得的训练好的卷积神经网络模型,获取待诊断电子病历分类信息;
其中,步骤1中构建事件实体集合时,同一事件实体只提取一次;步骤1中,事件实体包含诊断结果、检验化验结果、患者症状以及用药信息中的一种或多种;
步骤4中,用获得的卷积神经网络模型预测未标注数据集中样本电子病历数据的分类概率,根据预测获得的分类概率,选择不确定性满足预设条件的电子病历数据补入标注数据集中;
其中,不确定性衡量方式为熵;熵越大,则不确定性越高;熵的计算公式为:
En(p)=-plog(p)–(1-p)log(1-p);
式中,p为预测的分类概率;
步骤4还包括:第一种选取原则,在未标注数据集中任取两个样本电子病历,提取二者在模型分类器之前的特征向量,以二者特征向量夹角的cos值作为相似度度量,计算公式为:
Sim(fc,fd)=cosfc,fd;
式中,c,d为在未标注数据集中任取的两个样本电子病历;fc、fd为选取的两个样本电子病历在模型分类器之前对应的特征向量;
需要补入标注数据集的集合G的计算公式为:
G=arg max(E(G)–α*Sim(G));
式中,E(G)为选取的样本集合G中所有样本的熵的平均值,Sim(G)为选取的样本集合G中任意两两样本的相似度的平均值,α为可调节参数,取值范围为大于0。
2.根据权利要求1所述的一种基于卷积神经网络和主动学习的电子病历分类方法,其特征在于,步骤3中,预设卷积神经网络模型包括:卷积层、池化层、全连接层和softmax层;
卷积层的输入用于接收训练数据;卷积层的输出作为池化层的输入,池化层的输出作为全连接层是输入,全连接层用于全连接操作;全连接层的输出作为softmax层的输入,softmax层用于输出预测分类概率。
3.根据权利要求2所述的一种基于卷积神经网络和主动学习的电子病历分类方法,其特征在于,步骤3中,每次卷积层和全连接层操作之后都进行ReLU非线性激活函数操作。
4.根据权利要求1所述的一种基于卷积神经网络和主动学习的电子病历分类方法,其特征在于,α的取值范围为0~1。
5.根据权利要求1所述的一种基于卷积神经网络和主动学习的电子病历分类方法,其特征在于,第二种补入批注数据集的电子病历数据的选取原则为:
选择补入的电子病历集合为Z,计算公式为:
Z=arg max(Sim(Z,L));
式中,Sim(Z,L)为选取的样本与已标注样本两两之间相似度的平均值;
根据两种选取原则的样本分类错误率,动态调整两种策略选择标注的电子病历数;若第二种选取原则的错误率更高,则增加Z选取的电子病历数,否则减少Z选取的电子病历数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910068242.7/1.html,转载请声明来源钻瓜专利网。





