[发明专利]一种用于识别病历的疾病类型的模型的构建方法及应用有效
| 申请号: | 201811377664.4 | 申请日: | 2018-11-19 |
| 公开(公告)号: | CN111199801B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 罗立刚;刘晓华;罗翔凤;赵丽艳;康悦 | 申请(专利权)人: | 零氪医疗智能科技(广州)有限公司 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N3/02 |
| 代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;曲芳兵 |
| 地址: | 510627 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 识别 病历 疾病 类型 模型 构建 方法 应用 | ||
1.一种用于对病历的疾病类型进行识别的模型的构建方法,其特征在于,包括:
A、获取指定数量患者的各类病历信息;
B、对所述各类病历信息分别进行特征提取;
C、将提取的各类病历信息的特征进行连接以获取每位患者的整体的病历特征;
D、将所述每位患者的整体的病历特征输入至Soft-max分类器中进行分类训练,以获取用于对病历进行病历类型识别的神经网络模型;
所述步骤B,包括:
B1、对各类病历信息的原始文本分别进行向量化处理,将所述原始文本转换成one-hot独热特征向量;
B2、将所述one-hot独热特征向量,通过一指定大小的矩阵映射转换为长度为所述原始文本长度的矩阵;
B3、分别采用不同窗口大小的卷积核将长度为原始文本长度的所述矩阵处理生成一维卷积向量;
B4、将所述卷积向量分段池化后进行拼接,得到各类病历信息的特征向量;
所述步骤B1,包括:
B11、获取一病历库中所有病历的文本数据中出现的不同的字符,构建由所述字符组成的字典;
B12、构建一与所述字典长度相同的全零向量;其中所述全零向量的每一维对应一字符;
B13、将所述原始文本中出现的字符在所述全零向量中对应维度的值设置为1.0,以获取所述原始文本的one-hot独热特征向量。
2.根据权利要求1所述的方法,其特征在于,所述步骤A,包括:
A1、获取指定数量患者的病历;
A2、对所述病历中的各类病历信息分别进行定位;
A3、对定位后的各类病历信息分别进行原始文本的提取;
A4、对提取后的各类病历信息分别进行预处理。
3.根据权利要求2所述的方法,其特征在于,所述病历信息的类型至少包括但不限于以下其一:
病理描述、病理诊断、出院诊断、出院小结。
4.根据权利要求1所述的方法,其特征在于,步骤B3所述一维卷积向量的每个卷积向量的解析式为:
其中,所述inputk表示第k个感受野内的输入的原始文本长度的矩阵;所述wi表示第i个卷积核的参数;所述bias表示偏移量;所述convi表示第i个卷积核的卷积向量。
5.根据权利要求2所述的方法,其特征在于,所述预处理至少包括但不限于以下其一:去噪处理及二值化处理。
6.一种对病历的疾病类型进行识别的方法,基于权利要求1-5任一项所述方法的构建的神经网络模型,其特征在于,包括:
N1、获取待识别病历;
N2、将所述待识别病历进行预处理;
N3、将预处理后的所述待识别病历输入至所述用于对病历进行病历类型识别的神经网络模型中,以获取所述待识别病历的疾病类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于零氪医疗智能科技(广州)有限公司,未经零氪医疗智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811377664.4/1.html,转载请声明来源钻瓜专利网。





