[发明专利]一种图像处理方法、装置、终端设备及介质在审
申请号: | 202010490243.3 | 申请日: | 2020-06-02 |
公开(公告)号: | CN112801099A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 曹浩宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 处理 方法 装置 终端设备 介质 | ||
1.一种图像处理方法,其特征在于,所述方法包括:
将待处理图像转换为文本序列;
对所述文本序列进行键值分类,并基于键值分类结果确定所述文本序列包括的键字段和值字段;
将所述键字段和所述值字段两两组合,得到至少一个键值文本序列,每个键值文本序列中包括一个键字段和一个值字段;
获取所述每个键值文本序列中键字段和值字段的特征信息;
依照所述特征信息对所述每个键值文本序列中的键字段和值字段进行配对处理;
基于所述每个键值文本序列中键字段和值字段的配对结果输出所述待处理图像对应的结构化文本。
2.如权利要求1所述的方法,其特征在于,所述特征信息包括以下任一种或者多种:所述每个键值文本序列中键字段和值字段的语义信息、位置信息和属性信息,所述属性信息用于表征所述每个键值文本序列中键字段和值字段的字段类型,所述字段类型包括键字段类型或值字段类型,所述位置信息用于表征所述每个键值文本序列中键字段和值字段在所述待处理图像中的相对位置,所述位置信息包括所述每个键值文本序列中键字段和值字段在所述待处理图像中的位置坐标或相对于所述待处理图像的宽高比。
3.如权利要求1所述的方法,其特征在于,所述特征信息包括所述语义信息,所述获取所述每个键值文本序列中键字段和值字段的特征信息,包括:
依照所述每个键值文本序列中键字段和值字段的位置对所述每个键值文本序列进行切分处理;
通过语义表示模型对每个切分处理后的键值文本序列进行特征提取,得到所述每个键值文本序列中键字段和值字段的语义信息。
4.如权利要求2所述的方法,其特征在于,所述依照所述每个键值文本序列中键字段和值字段的位置对所述每个键值文本序列进行切分处理,包括:
依照所述每个键值文本序列中键字段和值字段的位置在所述每个键值文本序列中添加输入起始标志位、输入结束标志位、键字段的起始标志位、键字段的结束标志位、值字段的起始标志位和值字段的结束标志位。
5.如权利要求1所述的方法,其特征在于,所述配对处理是调用匹配模型进行的,所述配对结果指示了所述每个键值文本序列中键字段和值字段所属的关系对类别,所述关系对类别包括键值对类别或其它类别,所述基于所述每个键值文本序列中的键字段和值字段的配对结果输出所述待处理图像对应的结构化文本,包括:
依照所述每个键值文本序列中键字段和值字段的配对结果的指示,确定与所述文本序列中各个键字段配对的目标值字段,所述目标值字段为所述文本序列中与对应键字段所属的关系对类别为键值对类别的值字段;
按照显示规则显示所述各个键字段以及与所述各个键字段配对的目标值字段。
6.如权利要求1所述的方法,其特征在于,所述文本序列包含多个字段,每个字段包括一个或多个字符;
所述键值分类结果包括所述文本序列中各个字符的分类标签,所述分类标签用于指示字符的字符类型及字符在所属字段中的位置;所述位置包括以下任一种或者多种:起始位置、中间位置和结束位置;所述字符类型包括以下任一种或者多种:键字符、值字符和其它字符。
7.如权利要求2所述的方法,其特征在于,所述基于键值分类结果确定所述文本序列包括的键字段和值字段,包括:
按照所述各个字符的分类标签的指示,将所述文本序列中字符类型为键字符且属于同一字段的字符整合为键字段,以及将所述文本序列中字符类型为值字符且属于同一字段的字符整合为值字段。
8.如权利要求1所述的方法,其特征在于,所述键值分类是调用命名实体模型或者基于位置的单字分类模型进行的,所述值字段为所述文本序列中的命名实体,所述键字段为命名实体对应的文本项。
9.如权利要求1所述的方法,其特征在于,所述将待处理图像转换为文本序列,包括:
调用文本检测模型对获取到的待处理图像进行文本识别;
排版处理文本识别结果,得到所述待处理图像对应的文本序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010490243.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序