[发明专利]医疗文本中抽取疾病及其对应的化验指标实体词的方法及系统及装置在审
申请号: | 202110505502.X | 申请日: | 2021-05-10 |
公开(公告)号: | CN113420562A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 冯洪海;魏亚举;侯瑞辉 | 申请(专利权)人: | 河南大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/36;G06F40/211;G16H10/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 475004 河南省开封*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文本 抽取 疾病 及其 对应 化验 指标 实体词 方法 系统 装置 | ||
本发明公开了医疗文本中抽取疾病、化验指标实体的方法及系统及装置,并且抽取出其实体间的关系,涉及到了信息抽取相关领域。包括三大部分,第一由读取子系统组成,主要包含的是系统读取的模块。第二由计算子系统所组成,主要通过分解句子成分,抓住四大实体成分化验指标、异常值、关系词、疾病名称,首先利用其中三种初始词表来学习新的关键词,然后在大规模医疗文本中利用更新过后的实体词集合循环迭代触发相应的疾病名称、化验指标实体。第三由输出子系统组成,包含的有存储单元和输出单元两部分,存储为相关医疗实体词,输出为相关实体间的关系展示。本发明以公开的医疗文本为起点,最终实现了在医疗文本中相关实体要素的抽取。
技术领域
本发明涉及自然语言处理信息抽取的技术领域,具体涉及一种在医疗文本中抽取疾病及其对应的化验指标实体的方法及系统及装置。
背景技术
近年来,随着信息化社会的快速发展,网络中的医疗信息迅速增长,如何处理这些医疗信息就变得十分有意义,而其中的疾病、化验指标、和异常值之间的关系是进行疾病诊断的主要方面,疾病和化验指标及异常值的识别是构建医疗知识图谱重要的一环,以现在的人力和物力处理这些信息还非常有限,此时就需要专业人士来利用相关的技术进行处理就变得有非常大的研究意义和价值。而本发明主要分析医疗文本中的语义元素和句式结构,然后构建上述的初始实体词表,通过其中三种初始词表学习剩余的一种语义元素,通过更新过后的词汇,再次循环迭代,这样能够使我们提取的疾病、化验指标更准确。
自然语言处理作为计算机领域的一个重要研究方向,已广泛应用于各个领域,而且文本挖掘系统已经得到了实现,比如已经公布的CN111755091就涉及到了医疗信息的抽取。在之前已有的发明中主要提取的特征有症状、诱因、放化疗方案、疗效评价等,通过触发疾病信息抽取特征,最后通过无监督聚类实现文本聚类,并且是以时间节点进行切分,句子的完整语义没有考虑进去,输入文本仅仅包括了医院数据库中的病史记录,数据来源范围较小。而本发明充分考虑到了语义元素,考虑到了句式的因素。
在医疗领域的知识提取中面临着很多困难,主要有以下几个方面。
有丰富的实体类别,如几万种疾病,几千种化验指标,几十种异常值,其组合关系达千万种。
同一种词汇在不同语境中代表不同的含义。
有丰富的文本结构,如列表,句子,表格等。
各种各样的化验检验的方法、部位。
发明内容
本发明的目的在于提供一种在医疗文本中抽取疾病及其对应的化验指标实体词的方法及系统及装置,来建立疾病—化验指标—异常值之间的联系。本发明目的为以医疗文本为原始语料,最终实现在医疗文本中提取疾病、化验指标、异常值及对应的关系。
为实现上述目的,本发明提供一种在医疗文本中抽取疾病及其对应的化验指标实体词的方法,所述方法主要包括。
步骤1:系统将已由人工总结而成的化验指标、化验指标异常值、疾病、疾病与化验指标异常值之间的关系词等四种语义元素的词汇初值存储在外设中。
步骤2:系统将已由人工总结而成的疾病与化验指标异常对应关系描述句式存储在外设中。
步骤3:系统将已获取到的包含疾病与其异常化验指标关系的原始句子存储在外设中。
步骤4:系统循环地从外设中读取一种句式到内存中,然后循环地选择该句式中的n-1个元素作为输入去匹配该句式,系统将该n-1个语义元素对应的词表中的词汇循环地读取,并到步骤3的句子中匹配,如果匹配上,到步骤7学习该句式中属于剩余的1个语义元素集合中的词汇。
步骤5:将学习到的词汇由人工鉴别正误,鉴别为正确的词汇存放到步骤1所述的语义元素集合中。
步骤6:系统选择该句式中另外的n-1个元素作为输入去匹配该句式,但要包括刚刚学习并更新完的语义元素,返回步骤2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110505502.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制氩退火片边缘Haze的工艺
- 下一篇:一种管道损伤修补机器人