[发明专利]基于深度学习的辅助诊断方法及系统在审
申请号: | 201711010112.5 | 申请日: | 2017-10-25 |
公开(公告)号: | CN107833629A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 范晓亮;吴谨准;史佳;王玉杰;陈龙彪;郑传潘;王程;李军 | 申请(专利权)人: | 厦门大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20 |
代理公司: | 厦门致群专利代理事务所(普通合伙)35224 | 代理人: | 刘兆庆,陆庆红 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 辅助 诊断 方法 系统 | ||
1.基于深度学习的辅助诊断方法,其特征在于,包括以下步骤:
S1、由语料库导入原始语料数据,对原始语料数据进行分词处理,并建立词嵌入查询表;
S2、提取电子病历数据中的关键特征字段,并生成训练样本,使用所述词嵌入查询表对训练样本进行数字化转换,将数字化训练样本输入卷积神经网络进行训练,生成辅助诊断模型;
S3、对新输入的电子病历提取关键特征字段,并生成待预测集,使用所述词嵌入查询表对待预测集进行数字化转换,将数字化待预测集输入所述辅助诊断模型进行匹配,输出匹配的诊断结果。
2.如权利要求1所述的基于深度学习的辅助诊断方法,其特征在于,所述步骤S1具体包括:
S11、从语料库导入原始语料数据,对原始语料数据进行数据清洗;
S12、对语料数据进行中文分词,将得到的分词结果输入到词向量模型训练,建立词嵌入查询表。
3.如权利要求1所述的基于深度学习的辅助诊断方法,其特征在于,所述步骤S2具体包括:
S21、由电子病历数据库中提取已经确认无误诊的原始电子病历数据集,从原始电子病历数据集中提取出原始病历数据,对提取出的原始病历数据进行数据清洗;
S22、对清洗后的病历数据进行特征提取,提取医生在诊断中的关键特征字段;
S23、对S22提取出来的关键特征字段进行分词处理,生成训练样本;
S24、使用所述词嵌入查询表将训练样本中的每个词转换为对应的词向量;
S25、统一各特征字段的向量维度,最终拼接成整条诊断记录的向量表示形式,完成训练样本的数字化;
S26、将数字化的训练样本输入到卷积神经网络进行训练,生成辅助诊断模型。
4.如权利要求3所述的基于深度学习的辅助诊断方法,其特征在于:步骤S26中的卷积神经网络中,通过卷积核与数字化训练样本中的逐条向量按照某一方向进行卷积,并加上一个偏置项,通过激活函数输出一个特征;
则有,ci=f(w×xi∶i+h-1+b);
式中,ci代表新的特征;w代表一个卷积核,以k代表空间维度,一个窗口中包含h个诊断记录特征单元,则卷积核为w∈Rhk;xi:i+h-1表示从第i个关键特征字段到第i+h-1个关键字特征字段之间的向量值;b代表一个偏置项;f为非线性函数。
5.如权利要求1所述的基于深度学习的辅助诊断方法,其特征在于,步骤S3具体包括:
S31、对新输入的电子病历提取关键特征字段;
S32、对提取出的关键特征字段进行分词处理,获得待预测集;
S32、使用所述词嵌入查询表将待预测集中的每个词转换为对应的词向量;
S33、统一各特征字段的向量维度,最终拼接成整条诊断记录的向量表示形式,完成待预测集的数字化;
S34、将数字化的待预测集输入到所述辅助诊断模型,得出匹配的诊断结果。
6.如权利要求1所述的基于深度学习的辅助诊断方法,其特征在于:步骤S2及S3中提取的关键特征字段均包括主诉、现病史及体格检查结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711010112.5/1.html,转载请声明来源钻瓜专利网。