[发明专利]一种识别标签的方法及装置有效

专利信息
申请号: 201610061356.5 申请日: 2016-01-28
公开(公告)号: CN107016387B 公开(公告)日: 2020-02-28
发明(设计)人: 常江龙;陈雪峰;叶进进;刘裕峰;冯玉玺;杨现;张侦 申请(专利权)人: 苏宁云计算有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34
代理公司: 江苏圣典律师事务所 32237 代理人: 许峰;苏一帜
地址: 210042 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 标签 方法 装置
【权利要求书】:

1.一种识别标签的方法,其特征在于,包括:

读取拍摄得到的标签图像,并从所述标签图像中提取待筛选区域;

根据文本特征在所述待筛选区域中确定单文本行区域,所述文本特征包括其中至少一项:文本行的长度、文本面积占比、梯度占比和文本在单文本行区域的相对位置;

识别所述单文本行区域中的目标字符得到目标字符集合,并根据所述目标字符集合生成待输出的标签文本;

其中,对于单文本行,通过各个单文本行与标签文本的相关关系进行过滤;

在得到单行文本区域后进行校正,包括:

1)、进行水平区域扩展:沿着当前单文本行区域的水平外包络,对外扩展像素范围,看是否将其他文本区域扩展进来;如果有水平相邻的文本区域,则判断两个文本区域的朝向、高度、轴心等特征是否相近;相近则将区域进行合并处理,否则停止水平扩展;

2)、进行水平和竖直方向的去噪校正:得到各个单字符区域,将其中长宽比与汉字/英文/数字相似的区域抽取出来,形成待选文字区域集合;利用所述待选文字集合里的文字区域,计算统一的上边界线和下边界线,并截取左右边界,得到新的单文本行区域;

3)、区域旋转:根据所述新的单文本行区域在图像中的偏转程度,将新的单文本行区域对应的原灰度图进行旋转,使横向的轴心线成为水平,所得的旋转后图像为单文本行图像。

2.根据权利要求1所述的方法,所述从所述标签图像中提取待筛选区域,包括:

对所述标签图像进行边缘检测,得到所述标签图像的轮廓图;

对所述标签图像的轮廓图进行二值化处理,得到边缘二值图,所述二值化处理包括:通过不同颜色分别标记所述轮廓图中的背景和边缘;

对所述边缘二值图进行填充,得到填充边缘二值图,其中,在所述填充边缘二值图中具有同一边缘的区域闭合;

在所述填充边缘二值图中进行边缘搜索,得到存在闭合轮廓的区域,并从所述存在闭合轮廓的区域中提取所述待筛选区域。

3.根据权利要求1所述的方法,其特征在于,所述根据文本特征在所述待筛选区域中确定单文本行区域,包括:

在所述待筛选区域中,检测存在的单字区域,并得到单字区域集合;

过滤单字区域集合中异常区域,所述异常区域包括长宽比、宽度、长度、面积不符合所述文本特征的区域;

在过滤了异常区域的单字区域集合中,根据所述文本特征聚合单字区域,得到单字区域子集,将得到的单字区域子集所在区域确定为所述单文本行区域,其中,各个单字区域子集之间在纵向位置不重叠,且一个单字区域子集构成一个单文本行。

4.根据权利要求3所述的方法,其特征在于,所述过滤单字区域集合中异常区域,包括:

根据已完成标签识别的训练样本集合,训练二类分类器,所述二类分类器用于判定是否为所述异常区域;并根据所述文本特征,通过所述二类分类器标记单字区域集合中的异常区域;

或者,根据已完成标签识别的训练样本集合和所述文本特征生成规则集;并根据所述规则集在单字区域集合中筛选正常区域,并将正常区域以外的部分标记为所述异常区域。

5.根据权利要求2所述的方法,其特征在于,所述识别所述单文本行区域中的目标字符得到目标字符集合,并根据所述目标字符集合生成待输出的标签文本,包括:

根据所述边缘二值图和字符格式参数,切分所述单文本行区域中的单文本行,得到待识别字符,所述字符格式参数包括字符宽度;

获取字符搜索策略,并根据所述字符搜索策略识别所述待识别字符,得到所述目标字符;

根据预设的语言模型对所述目标字符进行校正,得到所述待输出的标签文本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610061356.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top