[发明专利]一种基于半监督字典学习的图像识别方法及装置在审
申请号: | 201710854155.5 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107832772A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 杨猛;陈林 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 深圳青年人专利商标代理有限公司44350 | 代理人: | 吴桂华 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 字典 学习 图像 识别 方法 装置 | ||
技术领域
本发明属于计算机技术领域,尤其涉及一种基于半监督字典学习的图像识别方法及装置。
背景技术
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,目前已被广泛地应用到各个领域,以实现用户认证或安全监控等功能。人脸识别的精确度决定了人脸识别的应用前景,因此,涉及人脸识别领域的公司和科研机构都投入了大量的人力物力来不断提高人脸识别的精确度。
近几年来,基于稀疏表示的人脸识别技术在提高人脸识别效果方面取得了较好的成效。稀疏表示将构成人脸图像的所有像素值按列排列,构成该人脸图像的特征向量,另外,稀疏表示认为每个人的人脸图像都位于各自的线性子空间内,任何一个待识别的人脸图像的特征向量可以由该人的其它人脸图像的特征向量进行线性表示,因此,为了能够对特征向量进行较好的线性表示,对于每一个人,只有在数据库中应拥有足够多的样本,才能构成足够大的线性子空间。然而,在实际应用中,由于给样本进行标注需要耗费大量的时间和人力,因此,在现实生活中通常会有大量的未标注样本。
半监督字典学习就是利用了未进行标注的人脸图像样本,以提高人脸识别的识别效果。然而,现有的半监督字典学习忽视了无标签样本所包含的鉴别信息,不能有效利用无标签样本,使得基于半监督字典学习的人脸识别软件或算法的识别效果仍然不是很好。
发明内容
本发明的目的在于提供一种基于半监督字典学习的图像识别方法及系统,旨在解决由于现有技术无法有效利用未标注图像样本,使得图像识别的识别效果不佳的问题。
一方面,本发明提供了一种基于半监督字典学习的图像识别方法,所述方法包括下述步骤:
接收输入的待识别图像,获取所述待识别图像的特征向量;
根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,所述各个子图像字典与不同类别的图像采集对象相对应;
根据所述编码系数计算所述待识别图像在所述各个子图像字典上的重构误差,获取所述重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为所述待识别图像对应的识别对象。
另一方面,本发明提供了一种基于半监督字典学习的图像识别装置,所述装置包括:
向量获取单元,用于接收输入的待识别图像,获取所述待识别图像的特征向量;
系数获取单元,用于根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,所述各个子图像字典与不同类别的图像采集对象相对应;以及
对象确定单元,用于根据所述编码系数计算所述待识别图像在所述各个子图像字典上的重构误差,获取所述重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为所述待识别图像对应的识别对象。
本发明在接收输入的待识别图像后,获取待识别图像的特征向量,根据特征向量获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,根据编码系数计算待识别图像在各个子图像字典上的重构误差,获取重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为待识别图像对应的识别对象,从而使得待识别图像在预先构建的半监督图像字典对应的子图像字典上取得最小的重构误差,提高了待识别图像的识别能力。
附图说明
图1是本发明实施例一提供的基于半监督字典学习的图像识别方法的实现流程图;
图2是本发明实施例二提供的基于半监督字典学习的图像识别装置的结构示意图;以及
图3是本发明实施例三提供的基于半监督字典学习的图像识别装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的基于半监督字典学习的图像识别方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,接收输入的待识别图像,获取待识别图像的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710854155.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:对包括文字内容和图像内容的图片识别
- 下一篇:一种场景匹配方法及装置