[发明专利]病历结构化的处理方法和装置在审
申请号: | 201710114644.7 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106897568A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 邓侃;孙俊;邱鹏飞;李丕勋 | 申请(专利权)人: | 北京大数医达科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/21;G06F17/27 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
地址: | 100193 北京市海淀区东北旺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病历 结构 处理 方法 装置 | ||
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种病历结构化的处理方法和装置。
背景技术
病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医学活动过程所作的文字记录。病历既是临床实践工作的总结,又是探索疾病规律及处理医学纠纷的法律依据,是国家的宝贵财富。
由于不同的医务人员往往存在着表达方式、书写习惯等个性化特点的差异,医务人员在录入病历的时候,经常混杂大量不规范的同义词、缩写用法,甚至还有错别字,使用的句型不仅多样化,而且可能不规范。即使是同一种疾病或者症状,不同的医务人员可能也会分别采用不同的同义词或近义词来表述,例如,“阿尔茨海默病”、“阿兹海默症”与“老年痴呆”;“纳差”与“食欲不振”等。因此,病历结构化对于有效整理病历,按规定的格式和要求书写的患者医学健康档案,从中挖掘医生临床经验,对医学进步具有重大意义。
发明内容
本发明提供了一种病历结构化的处理方法和装置,以解决现有的能够解决病例样本中自然语句用词不准确以及表达不规范等问题,实现病历结构化处理的高准确性、高容差性以及结构严谨性。
第一方面,本发明实施例提供了一种病历结构化的处理方法,该方法包括:
获取病历样本中的至少一个自然语句,根据预设规则获取所述自然语句中的医学实体,并确定出各医学实体之间的依存关系;
在预先建立的医学知识库中,获取与所述医学实体所对应的医学标准化用语以及各所述医学标准化用语之间的拓扑关系;
基于所述医学标准化用语、所述拓扑关系以及所述依存关系,将所述自然语句根据预设的语句结构转化成形式化语句。
第二方面,本发明实施例还提供了一种病历结构化的处理装置,该装置包括:
医学实体获取模块,用于获取病历样本中的至少一个自然语句,根据预设规则获取所述自然语句中的医学实体,并确定出各医学实体之间的依存关系;
医学标准化用语获取模块,用于在预先建立的医学知识库中,获取与所述医学实体所对应的医学标准化用语以及各所述医学标准化用语之间的拓扑关系;
形式化语句转化模块,用于基于所述医学标准化用语、所述拓扑关系以及所述依存关系,将所述自然语句根据预设的语句结构转化成形式化语句。
本发明实施例的技术方案,通过获取病例样本中的自然语句,然后获取病例样本中的自然语句中的医学实体以及各医学实体之间的依存关系,能够准确地识别出自然语句中的关键信息以及结构关系,以便更好地调整自然语句;进而获取各医学实体的医学标准化用语,可以使得自然语句中的医学实体表达更加规范化,获取到的各医学标准化用语之间的拓扑关系,有利于进一步梳理自然语句中各医学实体之间的拓扑关系;最后,将自然语句根据预设的语句结构转化成形式化语句,从而实现自然语句向措辞标准化,句法标准化的形式化语言的转化。本技术方案,不仅解决了病例样本中自然语句用词不准确以及表达不规范等问题,而且实现了高准确、高容差以及结构严谨的病历结构化处理。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一所提供的一种病历结构化的处理方法的流程示意图;
图2A为本发明实施例二所提供的一种病历结构化的处理方法的流程示意图;
图2B为本发明实施二所适用的一种LSTM单元的门构造示意图;
图3为本发明实施例三所提供的一种病历结构化的处理方法的流程示意图;
图4为本发明实施例四所提供的一种病历结构化的处理方法的流程示意图;
图5为本发明实施例五所提供的一种病历结构化的处理装置的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大数医达科技有限公司,未经北京大数医达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710114644.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用