[发明专利]一种图片自动化分类方法、图片处理方法及其装置在审
申请号: | 201210276320.0 | 申请日: | 2012-08-03 |
公开(公告)号: | CN103577475A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 贾梦雷;王永攀;郑琪 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 自动化 分类 方法 处理 及其 装置 | ||
技术领域
本申请涉及图片处理技术领域,特别涉及一种海量图片自动化分类方法、基于图片分类的图片处理方法,以及各自对应的装置。
背景技术
随着互联网技术的发展,信息海量增加,网络图片及图片数据也迅猛增长。图片作为一种重要的信息源(载体),通常需要进行集中存储、处理以及某些个性化应用。但是,这些图片往往来源各异、格式不同,图片形式千差外别。为满足对图片的正常利用,常常需要对这些海量图片进行分类,以便进行差别化管理(处理)。
现有技术中的图片分类方式是采用人工判别机制,即通过人工劳动将大量的图片按照预设规则逐一进行类别区分和归并。这种方式虽然简洁、方便,但是,需要浪费大量人力、物力以及经济成本,分类效率较低,尤其面对海量图片时,更是如此。而且,人工判别方式由于不断重复机械劳动,容易疲劳,导致分类不准确,从而无法满足各自实际应用需要。
发明内容
有鉴于现有技术存在的问题,本申请实施例提供了一种图片自动化分类方法、基于图片分类的图片处理方法及其相应的装置,以实现图片自动化分类和处理,提高图片分类和处理的效率和准确度。
本申请实施例提供的图片自动化分类方法包括:
接收待分类图片;
读取特征库内的特征类目;
根据所述特征类目提取所述待分类图片的特征数据;
匹配提取的特征数据与所述特征类目对应的预设特征数据,将特征数据可匹配的待分类图片归并为一类。
优选地,所述特征类目包括图片背景、图片前景、图片文字和/或图片人物。
进一步优选地,所述特征类目为图片背景和/或图片前景,所述与特征类目对应的预设特征数据包括图片背景的背景颜色数、背景色,和/或,图片前景的前景颜色数、前景区域个数、前景位置区域,则:所述根据特征类目提取所述待分类图片的特征数据包括:
将所述待分类图片划分为一个或多个子图;
提取各个子图的背景颜色数、背景色,和/或,提取各子图的前景颜色数、前景区域个数、前景区域位置。
进一步优选地,提取子图的前景颜色数、前景区域个数、前景区域位置具体包括:
统计预设颜色集合内的每种颜色在所述子图范围内的像素点数;
按照下式计算每种颜色的显著度值:
式中:ci为预设颜色集合内的第i个元素,N为颜色集合的元素个数,wi为预设颜色集合内的第i种颜色在子图范围内的像素点数,dist(ck·ci)为颜色集合内两种颜色之间的距离;
将子图内每个像素点的颜色显著度值作为该像素点的显著度值;
将像素点显著度值之和大于预设阈值的区域识别为前景区域;
根据识别的前景区域确定前景颜色数、前景区域的个数、前景区域位置。
优选地,所述特征类目为图片文字,所述与特征类目对应的预设特征数据包括文字区域位置、文字区域大小和/或文字内容,则:所述根据特征类目提取所述待分类图片的特征数据包括:
对所述待分类图片进行文字区域定位,以确定文字区域位置和/或文字区域大小;和/或,
对所述待分类图片进行文字区域定位后进行文字识别,以确定文字区域的文字内容。
进一步优选地,对所述待分类图片进行文字区域定位具体包括:通过基于纹理统计法或基于区域分析法进行文字区域定位,和/或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210276320.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:搜索方法和搜索引擎
- 下一篇:双语语料库的数据扩充方法和装置