[发明专利]电子病历的处理方法及系统有效
申请号: | 201711014644.6 | 申请日: | 2017-10-26 |
公开(公告)号: | CN107578798B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 朱少杰 | 申请(专利权)人: | 北京康夫子健康技术有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/289;G06K9/62 |
代理公司: | 北京千壹知识产权代理事务所(普通合伙) 11940 | 代理人: | 王玉玲 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病历 处理 方法 系统 | ||
本发明实施例提供一种电子病历的处理方法及系统,属于电子病历技术领域,解决了现有技术中对电子病历进行子主题划分的问题。所述方法包括:对电子病历文本进行预处理,获取所述电子病历文本中的病历编号、标题和句子集;根据所述句子集中的内容和预设子主题类型,确定所述句子集中的每个句子的子主题类型;矫正所述句子集中的句子的子主题类型,得到所述电子病历文本对应的结构化病历。本发明实施例适用于对电子病历的处理过程。
技术领域
本发明涉及电子病历技术领域,具体地涉及一种电子病历的处理方法及系统。
背景技术
病历是医生对于患者病情的发生发展做的最详细、最全面的纪录,也是科研人员对医学研究的重要依据和数据来源。然而,电子病历的存储格式多样,病情描述习惯更是因人而异,以致在病历检索时,往往不能获取准确的相关病历。
针对这些内容丰富、形式多样,噪声多的电子病历,现有的病历结构化的粒度都是在词语级别,直接提取症状、疾病等实体,这样带来的弊端是无法获取指定主题部分的信息,同时也会对某些疾病、症状的分析不够准确。
发明内容
本发明实施例的目的是提供一种电子病历的处理方法及系统,解决了现有技术中对电子病历进行子主题划分的问题,提高了细粒度的结构化信息抽取的准确性。
为了实现上述目的,本发明实施例提供一种电子病历的处理方法,包括:
对电子病历文本进行预处理,获取所述电子病历文本中的病历编号、标题和句子集;
根据所述句子集中的内容和预设子主题类型,确定所述句子集中的每个句子的子主题类型;
矫正所述句子集中的句子的子主题类型,得到所述电子病历文本对应的结构化病历,所述结构化病历包括病历编号、标题和子主题内容块,所述子主题内容块中的每个句子属于同一子主题类型。
进一步地,所述对电子病历文本进行预处理包括:
提取所述电子病历文本中的病历编号、标题和正文;
消除所述标题和正文中存在的噪声信息;
利用切分符将所述正文进行切分,得到所述正文对应的句子集。
进一步地,所述利用切分符将所述正文进行切分,得到所述正文对应的句子集包括:
利用一级切分符将所述正文进行切分,得到待切分句子集;
利用二级切分符对所述待切分句子集进行二次切分,得到所述正文对应的句子集,其中所述一级切分符的优先级高于所述二级切分符的优先级。
进一步地,所述根据所述句子集中的内容和预设子主题类型,确定所述句子集中的每个句子的子主题类型包括:
根据预设学习算法,将所述句子集中的每个句子的信息转换为特征向量;
根据预设分类器、所述预设子主题类型和每个句子对应的特征向量,确定所述句子集中的每个句子的子主题类型。
进一步地,所述方法还包括:
将所述标题和所述句子集中的首句分别与预设病历类型进行匹配,得到第一候选病历类型和第二候选病历类型;
当所述第一候选病历类型和第二候选病历类型相同时,选择其一为所述电子病历文本的所属病历类型;
当所述第一候选病历类型和第二候选病历类型不相同时,根据所述预设病历类型中的优先级排序,选择所述第一候选病历类型和第二候选病历类型中优先级高的病历类型为所述电子病历文本的所属病历类型。
进一步地,所述根据预设学习算法,将所述句子集中的每个句子的信息转换为特征向量包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京康夫子健康技术有限公司,未经北京康夫子健康技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711014644.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种激光切割机上下料装置
- 下一篇:一种智慧医疗病情跟踪系统及方法