[发明专利]数据处理方法、装置、计算机可读介质及电子设备在审

专利信息
申请号: 202010745286.1 申请日: 2020-07-29
公开(公告)号: CN111898528A 公开(公告)日: 2020-11-06
发明(设计)人: 苏晨;李斌;洪科元 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 深圳市隆天联鼎知识产权代理有限公司 44232 代理人: 叶虹
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理 方法 装置 计算机 可读 介质 电子设备
【说明书】:

本申请属于人工智能技术领域,具体涉及一种数据处理方法、数据处理装置、计算机可读介质以及电子设备。该方法包括:获取用于展示数据集合的待处理图像,所述数据集合包括至少一个数据对象;对所述待处理图像进行文本识别以得到所述数据对象的对象主体标识、对象关联标识以及所述数据集合的集合类型;根据所述对象主体标识在主体标识数据库中进行标识匹配以得到与所述对象主体标识相对应的一个或者多个标识本体;根据所述对象关联标识以及所述集合类型对所述标识本体进行筛选以得到目标本体,并建立所述数据对象与所述目标本体的映射关系。该方法可以在提高数据处理效率的同时获得更加准确的数据处理结果。

技术领域

本申请属于人工智能技术领域,具体涉及一种数据处理方法、数据处理装置、计算机可读介质以及电子设备。

背景技术

随着计算机技术的发展,基于计算机设备进行电子化地数据分析和数据存储相比于传统的纸质媒介具有极大的优势,不仅可以降低数据处理成本而且可以提高数据处理效率。

以医疗机构或者体检机构为例,通过各种检验设备可以对用户的身体机能和健康状况进行信息采集,以便基于采集到的数据进行健康评估或者风险预测。为了方便用户查看和携带,相关检验设备进行信息采集得到的数据一般会以纸质检验单的形式呈现。在此基础上,可以通过人工录入或者自动化识别的方式从纸质检验单中提取相关数据项以进行电子化地数据处理。由于数据项目种类繁多且形式多样,人工录入的数据提取方式对作业人员的知识水平有较高要求,需要消耗较高的人工成本和时间成本,而自动化识别的方式仅能适用于数据内容较为简单的场景,对于数据采集不全或者数据相似度程度高的相关数据,识别准确性较差,容易出现识别错误的问题。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本申请的目的在于提供一种数据处理方法、数据处理装置、计算机可读介质以及电子设备,至少在一定程度上克服数据提取和数据识别等相关技术中存在的处理效率低、准确性差等技术问题。

本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

根据本申请实施例的一个方面,提供一种数据处理方法,该方法包括:

获取用于展示数据集合的待处理图像,所述数据集合包括至少一个数据对象;

对所述待处理图像进行文本识别以得到所述数据对象的对象主体标识、对象关联标识以及所述数据集合的集合类型;

根据所述对象主体标识在主体标识数据库中进行标识匹配以得到与所述对象主体标识相对应的一个或者多个标识本体;

根据所述对象关联标识以及所述集合类型对所述标识本体进行筛选以得到目标本体,并建立所述数据对象与所述目标本体的映射关系。

根据本申请实施例的一个方面,提供一种数据处理装置,该数据处理装置包括:

图像获取模块,被配置为获取用于展示数据集合的待处理图像,所述数据集合包括至少一个数据对象;

文本识别模块,被配置为对所述待处理图像进行文本识别以得到所述数据对象的对象主体标识、对象关联标识以及所述数据集合的集合类型;

标识匹配模块,被配置为根据所述对象主体标识在主体标识数据库中进行标识匹配以得到与所述对象主体标识相对应的一个或者多个标识本体;

本体筛选模块,被配置为根据所述对象关联标识以及所述集合类型对所述标识本体进行筛选以得到目标本体,并建立所述数据对象与所述目标本体的映射关系。

在本申请的一些实施例中,基于以上技术方案,所述文本识别模块包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010745286.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top