[发明专利]一种信息处理的方法在审

申请号：	201711460305.0	申请日：	2017-12-28
公开（公告）号：	CN108021711A	公开（公告）日：	2018-05-11
发明（设计）人：	龙汉;李爱成;王海生	申请（专利权）人：	深圳市巨鼎医疗设备有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G16H15/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	518000 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信息处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及医学电子报告信息提取技术领域，尤其涉及一种信息处理的方法，包括以下步骤：系统初始化；获取医学电子报告中的中间格式数据；根据中间格式数据，获取中间格式数据中每个字符的位置，并根据每个字符的位置对每个字符按行和列重新排序；根据医学电子报告的预设规范，将医学电子报告进行分块；对医学电子报告中每一块逐行关键字匹配；根据每行的关键字，获取关键字对应的值；结构化信息整合并以JSON格式输出整合结果；对整合结果打分。本发明的一种信息处理的方法，实现医疗数据从PDF，XPS等的文件流数据到结构化数据的转换工作，该结构化数据可以用来做进一步的结构化存储或者传输，大大方便了数据的有效利用。

技术领域

本发明涉及医学电子报告信息提取技术领域，尤其涉及一种信息处理的方法。

背景技术

医学电子报告多以PDF，XPS格式文件为主，包含丰富的患者个人和病历数据，XPS文档与PDF文档类似，是一种只读文档格式，其采用结构化数据形式保存数据，在使用计算机读取文档内容时，需要进行相应的解析和提取处理。.net中有读取处理的组件，该组件虽能够获取XPS或PDF中的文本信息，但不公开提供坐标信息的获取能力，有个隐藏接口虽可获取坐标信息但准确度很低。目前多采用手工配置模板，程序自动进行模板匹配的方式进行结构化数据的提取，由于人工的高成本和非可控性，实现一个完成度高的模板配置方案非常困难，导致提取效率低下，提取范围受限。

发明内容

针对现有技术中存在的问题，本发明提供一种信息处理的方法。

一种信息处理的方法，包括以下步骤：

系统初始化；

获取医学电子报告中的中间格式数据；

根据中间格式数据，获取中间格式数据中每个字符的位置，并根据每个字符的位置对每个字符按行和列重新排序；

根据医学电子报告的预设规范，将医学电子报告进行分块；

对医学电子报告中每一块逐行关键字匹配；

根据每行的关键字，获取关键字对应的值；

对医学电子报告中每一块提取到的结构化信息整合，以JSON格式输出整合结果；

通过评判算法对整合结果打分。

进一步的，在获取医学报告中的中间格式数据之前，还包括：