[发明专利]一种随访文件数据提取方法及系统有效
| 申请号: | 202010578559.8 | 申请日: | 2020-06-23 |
| 公开(公告)号: | CN111913910B | 公开(公告)日: | 2022-10-11 |
| 发明(设计)人: | 王学理 | 申请(专利权)人: | 复旦大学附属中山医院厦门医院 |
| 主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/14;G06F16/16;G06F16/81;G06F16/832;G06V30/148 |
| 代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 吴圳添 |
| 地址: | 361000 福*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 随访 文件 数据 提取 方法 系统 | ||
本发明公开了一种随访文件数据提取方法,包括以下步骤:构建设备的索引文件和配置文件;获取并读取设备的随访文件,提取文本内容,另存为文本文件,同时获取设备型号;在索引文件中检索与设备型号对应的配置文件,选定配置文件;解析配置文件,形成数据清单,以及获取需要从文本文件中提取的数据内容;从文本文件提取数据,将数据填入数据清单,另存为输出文件,其中,数据内容包括数据、用于定位数据的关键词和数据与关键词的关系。本发明构建每个型号的设备的配置文件,通过关键词对需要提取的数据进行定位并提取。
技术领域
本发明涉及信息处理领域,特别是一种随访文件数据提取方法及系统。
背景技术
随着医疗信息化的普及,医疗设备的随访报告已纳入医院的电子病历中。医疗设备的随访通过各自厂家的程控仪进行,程控仪在给出热敏纸的随访报告的同时,还会生成PDF格式的随访文件。由于医疗设备的厂家多、型号多,甚至一家公司就有上百个型号,并且不同厂家和型号的随访文件的内容的格式以及使用的术语并不统一,进行结构化数据提取工作量很大。开发人员开发结构化数据提取软件需要了解每个型号的随访文件的内容的格式以及使用的术语后,再一一编写代码。因此,目前仅有个别装机量大的型号实现了结构化数据提取。而且,当程控仪的版本升级后,如果生成的随访文件内容的格式或使用的术语发生变动,软件的代码也需要重新进行编写。
发明内容
本发明为解决上述问题,提供了一种随访文件数据提取方法及系统,构建每个型号的设备的配置文件,通过关键词对需要提取的数据进行定位并提取。
为实现上述目的,本发明采用的技术方案为:
一种随访文件数据提取方法,包括以下步骤:
构建设备的索引文件和配置文件;
获取并读取所述设备的随访文件,提取文本内容,另存为文本文件,同时获取设备型号;
在所述索引文件中检索与所述设备型号对应的所述配置文件,选定所述配置文件;
解析所述配置文件,形成数据清单,以及获取需要从所述文本文件中提取的数据内容;
从所述文本文件提取数据,将所述数据填入所述数据清单,另存为输出文件;
其中,所述数据内容包括所述数据、用于定位所述数据的关键词和所述数据与所述关键词的关系。
优选的,所述数据与所述关键词的关系包括下列中的一种:
所述数据与所述关键词的相对位置关系、
所述数据同时与所述关键词和间隔符号的相对位置关系、
所述关键词为正则表达式,所述数据为所述正则表达式的部分或全部。
优选的,所述索引文件的数据格式为XML、JSON和INI中的一种。
优选的,所述索引文件使用数据库的方式。
优选的,获取所述设备型号后,将相同的所述设备型号的所述文本文件存储于一个文件夹内,对于所述文件夹内的所述文本文件,批量在所述索引文件中检索与所述设备型号对应的所述配置文件,选定所述配置文件。
优选的,若所述随访文件为图片模式,先通过OCR技术对所述随访文件的图片内容进行文字识别,再提取所述文本内容。
优选的,获取设备型号的同时还获取所述文本文件的使用语言,然后选定所述配置文件的方法为在所述索引文件中检索与所述设备型号和所述使用语言同时对应的所述配置文件。
优选的,所述设备为起搏器,所述随访文件通过程控仪生成。
基于同样的发明构思,本发明还提供一种随访文件数据提取系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学附属中山医院厦门医院,未经复旦大学附属中山医院厦门医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010578559.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





