[发明专利]用于识别收件人地址中的至少部分地址的装置和方法在审

专利信息
申请号: 201811555067.6 申请日: 2018-12-19
公开(公告)号: CN111340029A 公开(公告)日: 2020-06-26
发明(设计)人: 于小亿;孙俊 申请(专利权)人: 富士通株式会社
主分类号: G06K9/34 分类号: G06K9/34;G06F16/29
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 杜诚;李德山
地址: 日本神*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 识别 收件人 地址 中的 至少 部分 装置 方法
【说明书】:

本公开内容涉及用于识别收件人地址中的至少部分地址的装置和方法。根据本公开内容的一个实施方式,该装置包括:过分割单元,被配置成通过对至少部分地址的图像进行过分割得到过分割块序列;识别单元,被配置成通过对图像进行光学字符识别得到第一字符串;搜索单元,被配置成从地址数据库中搜索出与第一字符串匹配的多个候选字符串;相似度确定单元,被配置成通过执行动态时间规整确定过分割块序列与各个候选字符串的相似度;以及选择单元,被配置成根据相似度选择多个候选字符串之一作为至少部分地址的识别结果。使用该装置和方法至少能实现如下效果之一:提高识别日文收件人地址的中地址的准确程度和识别效率。

技术领域

本公开总体上涉及图像处理领域,具体地,涉及用于识别收件人地址中的至少部分地址的装置和方法。

背景技术

随着计算机性能的发展,OCR(Optical Character Recognition,光学字符识别)技术已经广泛地应用于人们日常生活的众多领域。例如,利用OCR技术识别文档图像中的文字以便于进一步进行处理。

收件人地址是常见的,如包裹、信件等邮件上的收件人地址。对于日文收件人地址,其通常被标识在3个相邻行中。处于3个相邻行的上方的行的地址分段被称为上地址。上地址包含例如省、城市、行政区的地址信息。处于3个相邻行中间的行的地址分段被称为中地址。中地址中的字符选自由字符“番”、“地”、“丁”、“目”、“号”、“-”、“0”、“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”和“9”构成的字符集合S。处于3个相邻行的下方的行的地址分段被称为下地址。下地址包含本地的具体的地址信息。

根据邮件上标识的收件人地址对邮件进行自动分类是期望的。进一步的,希望提高分类(即,识别)的效率和准确度。

发明内容

在下文中将给出关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,此概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

根据本公开内容的一个方面,提供了一种用于识别收件人地址中的至少部分地址的装置,包括:过分割单元,被配置成通过对至少部分地址的图像进行过分割得到过分割块序列;识别单元,被配置成通过对图像进行光学字符识别得到第一字符串;搜索单元,被配置成从地址数据库中搜索出与第一字符串匹配的多个候选字符串;相似度确定单元,被配置成通过执行动态时间规整确定过分割块序列与各个候选字符串的相似度;以及选择单元,被配置成根据相似度选择多个候选字符串之一作为至少部分地址的识别结果。

根据本公开内容的一个方面,提供了一种用于识别收件人地址中的至少部分地址的方法,包括:通过对至少部分地址的图像进行过分割得到过分割块序列;通过对图像进行光学字符识别得到第一字符串;从地址数据库中搜索出与第一字符串匹配的多个候选字符串;通过执行动态时间规整确定过分割块序列与各个候选字符串的相似度;以及根据相似度选择多个候选字符串之一作为至少部分地址的识别结果。

根据本公开内容的一个方面,提供了一种对具有收件人地址的邮件进行分类的方法,包括:通过执前述方法,获得的至少部分地址的识别结果;以及基于识别结果对邮件进行分类。

根据本公开内容的一个方面,提供了一种存储介质,其上存储有用于执行前述用于识别收件人地址中的至少部分地址的方法的程序。

使用该装置和方法至少能实现如下效果之一:提高识别收件人地址的识别准确程度和识别效率。

附图说明

本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811555067.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top