[发明专利]一种以ODL为基础从医学图像中提取结构化文本信息的方法在审

专利信息
申请号: 202110317727.2 申请日: 2021-03-25
公开(公告)号: CN112990039A 公开(公告)日: 2021-06-18
发明(设计)人: 韦嘉;叶翔赟 申请(专利权)人: 上海基绪康生物科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G16H30/20
代理公司: 武汉智新达知识产权代理事务所(特殊普通合伙) 42272 代理人: 李丹萍
地址: 200000 上海市浦东新区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 odl 基础 医学 图像 提取 结构 文本 信息 方法
【说明书】:

发明涉及医学图像的信息提取技术领域,且公开了一种以ODL为基础从医学图像中提取结构化文本信息的方法,包括以下步骤:1)医学图像经OCR处理以后,形成结构化结果文件,对于每一个结果文件,只收集叶片文本框作为原始图像数据输入到模糊解析器中,并用方程式D表述;2)向解析器中输入记录在ODL中的用户对需要解析图像的描述;3)解析器匹配用户描述的文本元素与D中的文本信息,并输出分析树式的解析结果;4)完成多个图像文件分析之后,系统会自动收集所有检测到的解析错误,将最常见的几种解析错误展现给用户并提示人为修改以优化纠错模型。本方案具有使用方便、解析过程稳健、容错率广和保证信息提取的更高准确度等优点。

技术领域

本发明涉及医学图像的信息提取技术领域,具体为一种以ODL为基础从医学图像中提取结构化文本信息的方法。

背景技术

随着医疗硬件和相关软件的不断发展,众多的医学图像,比如心电图(ECG)、磁共振成像(MRI)、X光片(X-ray)以及超声图等都被直接打印并保留在纸质材料上,这些图像文件不光含有图像信息还包含了不少文本信息,例如仪器使用的参数设置、检测值和一些简单的结论等,为了建立易于管理的患者电子医疗档案,从这些医学图像文件中提取相应文本信息的需求也在不断增强。

很多光学符号识别(OCR)软件都可以实现从图像文件中识别带有位置信息的文本框并以可扩展标记语言(XML)的形式进行保存,但是由这些OCR软件识别的文本有时会由于种种问题存在失真,同时OCR软件也不会主动去采集结构化的文本信息,所以需要额外的方法从OCR软件得到的结果中提取更加精确的结构化文本信息。

目前已存在几种简单的方案试图去解决这个问题,第一个方案,对每一个需要提取的数据写一个正则表达式,并且用这个表达式从OCR识别的文本框中提取相应的信息,可以被称为精确匹配法,但这个方案有两个比较明显的缺陷,其一,如果存在错误识别的文本就会导致与所写的正则表达式匹配不上,其二,OCR软件的识别结果的层次结构不总是可以组织成易读甚至可读的形式,很多因素都会影响结果的结构层次,比如图像的颜色、对比度、打印产生的噪点或者扫描的角度等,另外,还需要终端用户会用正则表达式;第二个方案比较直接,首先用户要对每一个数据所在的目标区域进行注释,然后将OCR软件直接运用于图像中该注释区域进行识别和采集,被称为区域OCR法,这种方法虽然直观易操作,但其准确度很大程度上依赖于用户对区域注释的精确性,无论注释区域设置得过大或者过小都会直接影响识别和采集的结果,除此以外,每张图像的目标区域即使格式相同也可能存在微小的位置差异,所以为了精确定位,就需要对每个图像进行检查甚至注释,这显然是相当繁碎且不易推广的;还有一个解决方案就是引入页面布局分析技术,该技术首先将扫描图像中所有的文本区从非文本区中区分开来,并且将它们按照其原始顺序进行排列,然后在每一个文本区中检测单个文本单元,所以可以被称为页面布局法,其实,页面布局分析主要适用于分析纯文本图像文件,即使如此,使用中也会遇到两个问题,首先,该技术建立在一个强假设的基础上,即所有格式相同的图像都会产生一摸一样的页面布局结果,图像中意外产生的噪点等都可能会影响页面布局从而最终导致完全错误的文本信息,其次,用户还需要使用包装函数去描述每一个所需数据所在的位置,这就已经使得非专家用户或者不会写包装函数的用户无法操作,为了突破以上各种方案的局限,故提出一种以ODL为基础从医学图像中提取结构化文本信息的方法以解决上述问题。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种以ODL为基础从医学图像中提取结构化文本信息的方法,具备使用方便、解析过程稳健、容错率广以及保证信息提取的更高准确度等优点,解决了现有的解决方案存在各种局限的问题。

(二)技术方案

为实现上述使用方便、解析过程稳健、容错率广以及保证信息提取的更高准确度等目的,本发明提供如下技术方案:一种以ODL为基础从医学图像中提取结构化文本信息的方法,包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海基绪康生物科技有限公司,未经上海基绪康生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110317727.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top