[发明专利]一种用于识别病历的疾病类型的模型的构建方法及应用有效
申请号: | 201811377664.4 | 申请日: | 2018-11-19 |
公开(公告)号: | CN111199801B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 罗立刚;刘晓华;罗翔凤;赵丽艳;康悦 | 申请(专利权)人: | 零氪医疗智能科技(广州)有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N3/02 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;曲芳兵 |
地址: | 510627 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 识别 病历 疾病 类型 模型 构建 方法 应用 | ||
本发明实施例公开了一种用于对病历的疾病类型进行识别的模型的构建方法及应用,所述方法包括:A、获取指定数量患者的各类病历信息;B、对所述各类病历信息分别进行特征提取;C、将提取的各类病历信息的特征进行连接以获取每位患者的整体的病历特征;D、将所述每位患者的整体的病历特征输入至Soft‑max分类器中进行分类训练,以获取用于对病历进行病历类型识别的神经网络模型。由上,本申请的方法构建的模型可以准确快速有效地实现对病历的疾病类型的识别。
技术领域
本发明涉及纳米材料领域,具体涉及一种用于识别病历的疾病类型的模型的构建方法及应用。
背景技术
结构化数据是指存储在数据库里,可以用二维表结构来逻辑表达实现的数据;反之,非结构化数据是指不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。其中,结构化数据内容遵循固定的格式,比较容易查询和处理。非结构化数据,由于占用内存交大和大小的不一致性,以及文件的性质导致对其存储和处理都不如结构化数据方便。
医疗行业信息化程度高,但也存在大量非结构化数据,严重影响临床医疗数据的数据处理和使用,导致医疗数据的利用率并不高,目前医疗数据的结构化势在必行,但是由于不同的疾病存在着明显区别,所以病历的结构化方式也有很大差异,采用通用结构化方式就会造成大量的结构冗余,不能满足不同疾病的个性化特点。因此,对病历的疾病类型的识别,对整份病历的结构化起着至关重要的作用。
目前,对病历疾病类型识别的方法通常分为两种:1、由专业的医学人员去人工读病历,作出疾病类型的判断;2、基于专业的医学知识,制定一些用于疾病确认的强规则来作出对疾病类型的判断。其中,前者需要花费大量的人力,并且产能完全无法匹配海量的病历数据;后者也需要人工花费时间去设计,评估,同时由于病历描述的多样性,规则的泛化能力很弱,维护起来非常困难。
因此,目前亟需一种用于对病历进行疾病类型识别的系统及应用,以实现准确快速有效地对病历的疾病类型的识别。
发明内容
有鉴于此,本发明的主要目的在于提供了一种用于识别病历的疾病类型的模型的构建方法及应用,以实现准确快速有效地对病历的疾病类型的识别。
本发明提供的一种用于识别病历的疾病类型的模型的构建方法,包括:
A、获取指定数量患者的各类病历信息;
B、对所述各类病历信息分别进行特征提取;
C、将提取的各类病历信息的特征进行连接以获取每位患者的整体的病历特征;
D、将所述每位患者的整体的病历特征输入至Soft-max分类器中进行分类训练,以获取用于对病历进行病历类型识别的神经网络模型。
由上,本申请在训练获取对病历类型继续识别的神经网络模型时,考虑了同一患者存在不同类型的各类病历信息,本申请分别对各类病历信息进行特征提取,并将提取后的各类病历信息整合后进行分类训练,从而使得获取得到的神经网络模型可以实现准确快速有效地对病历的疾病类型的识别。
优选地,所述步骤A,包括:
A1、获取指定数量患者的病历;
A2、对所述病历中的各类病历信息分别进行定位;
A3、对定位后的各类病历信息分别进行提取;
A4、对提取后的各类病历信息分别进行预处理。
由上,有利于获取指定数量患者的各类病历信息。
优选地,所述病历信息的类型至少包括但不限于以下其一:
病理描述、病理诊断、出院诊断、出院小结。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于零氪医疗智能科技(广州)有限公司,未经零氪医疗智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811377664.4/2.html,转载请声明来源钻瓜专利网。