[发明专利]一种整合特征字典结构与视觉特征编码的图像分类方法在审
| 申请号: | 201410693888.1 | 申请日: | 2014-11-26 |
| 公开(公告)号: | CN104331717A | 公开(公告)日: | 2015-02-04 |
| 发明(设计)人: | 杨育彬;朱启海 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
| 地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 整合 特征 字典 结构 视觉 编码 图像 分类 方法 | ||
技术领域
本发明涉及图像分类领域,特别是基于码书模型(Bag-of-Words,BoW)的一种整合特征字典结构与视觉特征编码的图像分类方法
背景技术
随着信息技术的不断飞速发展,各个领域每天都在以惊人的速度产生各种类型的数据,包括文字、图像、视频、音乐等。在丰富多彩的数据信息中,图像因其表现直观生动、内容丰富、信息量大,以及存储与传输方便,备受青睐,并已经成为二十一世纪最重要的信息载体之一。特别是随着照相机、手机、平板等具有拍照功能的移动设备的日益普及,以及社交网络的兴起,人们获取图像的方式越来越多,也进一步促使图像数据急剧增长,快速准确地查找所需图像和高效地管理却因此变得越来越困难。人们迫切希望计算机能帮助人类,对互联网中海量图像所蕴含的语义进行分析,并充分理解图像所表达的内容,从而更有效地对图像进行管理、分类标注,或检索感兴趣的图像。
图像分类作为计算机理解图像最主要的基础技术之一,已经受到了学术界和工业界各研究机构的广泛研究,并在国内外各权威期刊和重要学术会议上作为重要主题,是计算机视觉领域一个极重要的研究课题。图像分类是指按照一定的分类准则将图像智能化地分到一组已有定义类别中的过程,包括物体识别、场景语义分类、行为识别等。图像分类已经成为研究图像语义理解的重要技术手段。科学研究人员已经渐渐意识到以上问题的重要性并不断深入分析。近几年,码书模型为图像高层语义表示带来新的启发,以码书模型为关键技术的图像分类已取得了一定成果,但是仍有许多研究点尚未涉及,仍有巨大的突破空间。基于码书模型的图像分类方法的研究,已经成为当前人工智能、计算机视觉、机器学习和数据挖掘等诸多交叉领域中前沿性的热点,对积极推进社会信息化起到重要作用。在创造了无可替代的社会价值的同时,该领域仍有许多关键技术问题尚未解决,仍有许多功能实现需要进一步完善,因此,如何利用码书模型,更有效地理解和描述图像高层语义,以更灵活地实现图像分类的研究,具有深远的意义。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种整合特征字典结构与视觉特征编码的图像分类方法,利用特征字典中视觉单词的分布信息辅助视觉特征编码,以使编码结果更具有判别性,从而提高图像分类的准确率。
为了解决上述技术问题,本发明公开了一种整合特征字典结构与视觉特征编码的图像分类方法,包含如下步骤:
步骤1,提取图像的视觉特征:对每幅图像进行局部采样,得到一组区域块,提取每块区域的视觉特征,得到每幅图像对应的视觉特征集合,称所有图像的视觉特征集合的整体为所有图像的视觉特征集,记为集合X;
步骤2,特征字典学习:以集合X为输入,使用特征字典学习方法,得到由一组具有代表性的视觉单词组成的特征字典;
步骤3,视觉特征编码:将每幅图像的每个视觉特征表示成视觉单词的线性组合,每个视觉单词对应一个系数,称这组系数为视觉特征的编码;
步骤4,视觉特征编码的空间汇合:以每幅图像的所有视觉特征的编码为输入,使用统计方法,将每幅图像表示为一个向量,该向量就是对应图像的图像特征表示;
步骤5,将步骤4得到的每幅图像的编码作为输入,使用分类模型进行训练和分类,得到分类结果。
步骤1具体包括如下步骤:
对每幅图像I进行局部采样,采用等步长的方式做密集采样,得到若干大小相同的区域块,对每个区域块提取一个视觉特征,使用视觉特征提取方法得到表示该局部块一个视觉特征,视觉特征提取方法包括:方向梯度直方图(Histogram of Oriented Gradient,HOG),尺度不变特征变换(Scale-invariant feature transform,SIFT)等。得到图像I的视觉特征集合LFSI,最终得到所有图像的视觉特征集合的整体X=[x1,x2,…,xN]∈Rd×N,其中,d表示视觉特征的维度,其大小由视觉特征提取技术决定,N表示所有图像的视觉特征的总数,xi表示第i个视觉特征,i取值1~N。
步骤2具体包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410693888.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:不形成毛刺的激光钻孔
- 下一篇:多脉冲激光烧蚀金属覆层定量去除方法





