[发明专利]一种图像处理方法、装置、终端设备及介质在审

专利信息
申请号: 202010490243.3 申请日: 2020-06-02
公开(公告)号: CN112801099A 公开(公告)日: 2021-05-14
发明(设计)人: 曹浩宇 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强;杜维
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 处理 方法 装置 终端设备 介质
【权利要求书】:

1.一种图像处理方法,其特征在于,所述方法包括:

将待处理图像转换为文本序列;

对所述文本序列进行键值分类,并基于键值分类结果确定所述文本序列包括的键字段和值字段;

将所述键字段和所述值字段两两组合,得到至少一个键值文本序列,每个键值文本序列中包括一个键字段和一个值字段;

获取所述每个键值文本序列中键字段和值字段的特征信息;

依照所述特征信息对所述每个键值文本序列中的键字段和值字段进行配对处理;

基于所述每个键值文本序列中键字段和值字段的配对结果输出所述待处理图像对应的结构化文本。

2.如权利要求1所述的方法,其特征在于,所述特征信息包括以下任一种或者多种:所述每个键值文本序列中键字段和值字段的语义信息、位置信息和属性信息,所述属性信息用于表征所述每个键值文本序列中键字段和值字段的字段类型,所述字段类型包括键字段类型或值字段类型,所述位置信息用于表征所述每个键值文本序列中键字段和值字段在所述待处理图像中的相对位置,所述位置信息包括所述每个键值文本序列中键字段和值字段在所述待处理图像中的位置坐标或相对于所述待处理图像的宽高比。

3.如权利要求1所述的方法,其特征在于,所述特征信息包括所述语义信息,所述获取所述每个键值文本序列中键字段和值字段的特征信息,包括:

依照所述每个键值文本序列中键字段和值字段的位置对所述每个键值文本序列进行切分处理;

通过语义表示模型对每个切分处理后的键值文本序列进行特征提取,得到所述每个键值文本序列中键字段和值字段的语义信息。

4.如权利要求2所述的方法,其特征在于,所述依照所述每个键值文本序列中键字段和值字段的位置对所述每个键值文本序列进行切分处理,包括:

依照所述每个键值文本序列中键字段和值字段的位置在所述每个键值文本序列中添加输入起始标志位、输入结束标志位、键字段的起始标志位、键字段的结束标志位、值字段的起始标志位和值字段的结束标志位。

5.如权利要求1所述的方法,其特征在于,所述配对处理是调用匹配模型进行的,所述配对结果指示了所述每个键值文本序列中键字段和值字段所属的关系对类别,所述关系对类别包括键值对类别或其它类别,所述基于所述每个键值文本序列中的键字段和值字段的配对结果输出所述待处理图像对应的结构化文本,包括:

依照所述每个键值文本序列中键字段和值字段的配对结果的指示,确定与所述文本序列中各个键字段配对的目标值字段,所述目标值字段为所述文本序列中与对应键字段所属的关系对类别为键值对类别的值字段;

按照显示规则显示所述各个键字段以及与所述各个键字段配对的目标值字段。

6.如权利要求1所述的方法,其特征在于,所述文本序列包含多个字段,每个字段包括一个或多个字符;

所述键值分类结果包括所述文本序列中各个字符的分类标签,所述分类标签用于指示字符的字符类型及字符在所属字段中的位置;所述位置包括以下任一种或者多种:起始位置、中间位置和结束位置;所述字符类型包括以下任一种或者多种:键字符、值字符和其它字符。

7.如权利要求2所述的方法,其特征在于,所述基于键值分类结果确定所述文本序列包括的键字段和值字段,包括:

按照所述各个字符的分类标签的指示,将所述文本序列中字符类型为键字符且属于同一字段的字符整合为键字段,以及将所述文本序列中字符类型为值字符且属于同一字段的字符整合为值字段。

8.如权利要求1所述的方法,其特征在于,所述键值分类是调用命名实体模型或者基于位置的单字分类模型进行的,所述值字段为所述文本序列中的命名实体,所述键字段为命名实体对应的文本项。

9.如权利要求1所述的方法,其特征在于,所述将待处理图像转换为文本序列,包括:

调用文本检测模型对获取到的待处理图像进行文本识别;

排版处理文本识别结果,得到所述待处理图像对应的文本序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010490243.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top