[发明专利]一种识别标签的方法及装置有效
申请号: | 201610061356.5 | 申请日: | 2016-01-28 |
公开(公告)号: | CN107016387B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 常江龙;陈雪峰;叶进进;刘裕峰;冯玉玺;杨现;张侦 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 许峰;苏一帜 |
地址: | 210042 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 标签 方法 装置 | ||
1.一种识别标签的方法,其特征在于,包括:
读取拍摄得到的标签图像,并从所述标签图像中提取待筛选区域;
根据文本特征在所述待筛选区域中确定单文本行区域,所述文本特征包括其中至少一项:文本行的长度、文本面积占比、梯度占比和文本在单文本行区域的相对位置;
识别所述单文本行区域中的目标字符得到目标字符集合,并根据所述目标字符集合生成待输出的标签文本;
其中,对于单文本行,通过各个单文本行与标签文本的相关关系进行过滤;
在得到单行文本区域后进行校正,包括:
1)、进行水平区域扩展:沿着当前单文本行区域的水平外包络,对外扩展像素范围,看是否将其他文本区域扩展进来;如果有水平相邻的文本区域,则判断两个文本区域的朝向、高度、轴心等特征是否相近;相近则将区域进行合并处理,否则停止水平扩展;
2)、进行水平和竖直方向的去噪校正:得到各个单字符区域,将其中长宽比与汉字/英文/数字相似的区域抽取出来,形成待选文字区域集合;利用所述待选文字集合里的文字区域,计算统一的上边界线和下边界线,并截取左右边界,得到新的单文本行区域;
3)、区域旋转:根据所述新的单文本行区域在图像中的偏转程度,将新的单文本行区域对应的原灰度图进行旋转,使横向的轴心线成为水平,所得的旋转后图像为单文本行图像。
2.根据权利要求1所述的方法,所述从所述标签图像中提取待筛选区域,包括:
对所述标签图像进行边缘检测,得到所述标签图像的轮廓图;
对所述标签图像的轮廓图进行二值化处理,得到边缘二值图,所述二值化处理包括:通过不同颜色分别标记所述轮廓图中的背景和边缘;
对所述边缘二值图进行填充,得到填充边缘二值图,其中,在所述填充边缘二值图中具有同一边缘的区域闭合;
在所述填充边缘二值图中进行边缘搜索,得到存在闭合轮廓的区域,并从所述存在闭合轮廓的区域中提取所述待筛选区域。
3.根据权利要求1所述的方法,其特征在于,所述根据文本特征在所述待筛选区域中确定单文本行区域,包括:
在所述待筛选区域中,检测存在的单字区域,并得到单字区域集合;
过滤单字区域集合中异常区域,所述异常区域包括长宽比、宽度、长度、面积不符合所述文本特征的区域;
在过滤了异常区域的单字区域集合中,根据所述文本特征聚合单字区域,得到单字区域子集,将得到的单字区域子集所在区域确定为所述单文本行区域,其中,各个单字区域子集之间在纵向位置不重叠,且一个单字区域子集构成一个单文本行。
4.根据权利要求3所述的方法,其特征在于,所述过滤单字区域集合中异常区域,包括:
根据已完成标签识别的训练样本集合,训练二类分类器,所述二类分类器用于判定是否为所述异常区域;并根据所述文本特征,通过所述二类分类器标记单字区域集合中的异常区域;
或者,根据已完成标签识别的训练样本集合和所述文本特征生成规则集;并根据所述规则集在单字区域集合中筛选正常区域,并将正常区域以外的部分标记为所述异常区域。
5.根据权利要求2所述的方法,其特征在于,所述识别所述单文本行区域中的目标字符得到目标字符集合,并根据所述目标字符集合生成待输出的标签文本,包括:
根据所述边缘二值图和字符格式参数,切分所述单文本行区域中的单文本行,得到待识别字符,所述字符格式参数包括字符宽度;
获取字符搜索策略,并根据所述字符搜索策略识别所述待识别字符,得到所述目标字符;
根据预设的语言模型对所述目标字符进行校正,得到所述待输出的标签文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610061356.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆ABS或ASR传感器转接头
- 下一篇:一种汽车电源连接线