[发明专利]一种基于谱聚类和增强学习的自适应人脸图像聚类方法有效
申请号: | 201910663760.3 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110543816B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 钱丽萍;俞宁宁;周欣悦;吴远;黄亮 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 谱聚类 增强 学习 自适应 图像 方法 | ||
一种基于谱聚类和增强学习的自适应人脸图像聚类方法,包括以下步骤:1)应用深度卷积神经网络DCNN实现对数据库中所有人脸图片的特征表示;2)应用谱聚类算法实现对图像表征的聚类;3)基于增强学习算法自适应搜索最优的聚类数目和谱聚类降维参数,首先,给定期望聚类搜索范围,设定搜索步长及搜索起始点;接着执行Q‑Learning算法,在搜索范围内尝试所有可能的调参行为,并选择使得聚类性能最优的行为给予最大正向回报;直至所有行为都无法使得性能优化,或满足最大迭代次数,结束搜索;多次训练后搜索结束点即为最优参数的设定值。本发明通过动态调参和自适应搜索,能够帮助找到全局最优聚类数目和降维数,提升人脸图像聚类性能。
技术领域
本发明涉及一种自适应的人脸图像聚类方法,尤其是一种基于谱聚类和增强学习的自适应人脸图像聚类方法。
背景技术
随着计算机视觉和模式识别技术的快速发展,图像作为一种最普遍的视觉信息呈现模式,具有广泛的应用前景。在“大数据”时代,每天都产生着大量的图片。例如,在社交媒体上,据Facebook的报道每天平均产生3.5亿张图片,其中大部分是人脸图像。在司法调查中,依然有着庞大数量的图片急需鉴别和归类。在社会治安维护和监控管理上,由摄像头捕捉的大量人脸图像需要进行身份认证和入库比对。但是,这些人脸图像通常没有身份标签的,或者是标签遗失了。在面对如此庞大的图像数据库时,应用人工标注的方法难以保证身份辨认的准确性和有效性,并且是非常费时费力的。
机器学习的兴起为解决这一棘手的问题提供了有效的方案。近年来,深度卷积神经网络DCNN在图像特征提取和身份识别上展现出了优越的性能:根据目前国内外的研究,其识别性能已经远远超过了人眼。同时,数据聚类技术日益成熟,为解决大规模图像数据识别与归类问题提供了方法依据。当前应用于人脸图像聚类的算法主要有:谱聚类、基于层级划分的聚类方法、K-Means等。其中,谱聚类模型由于对数据分布的普遍适用性和对数据稀疏性不敏感的特点,已成为了主流聚类算法。
但是应用谱聚类算法实现大规模图像数据库的聚类,需要预先确定聚类数目和模型奇异值分解过程中的降维数。这两项参数的设定直接影响了聚类性能。由于在大规模数据库中,聚类数目的设定可能是成百上千的,难以估计。因此采用人工调参的方法费时费力且难以找到全局最优设定。
发明内容
为了克服现有人脸图像处理方式的聚类性能较差的不足,为了显著提升人脸图像聚类性能,本发明提供了一种基于谱聚类和增强学习的自适应人脸图像聚类方法,结合谱聚类模型和增强学习算法,通过动态调参和自适应搜索,能够帮助找到全局最优的聚类数目和降维数。
本发明解决其技术问题所采用的技术方案是:
一种基于谱聚类和增强学习的自适应人脸图像聚类方法,所述方法包括如下步骤:
1)应用深度卷积神经网络DCNN实现对数据库中所有人脸图片的特征表示,步骤如下:
步骤1.1:预处理是对图像做初步的修正处理;
步骤1.2:基于Dlib人脸标注的68个特征点,准确定位图像中的人脸区域并裁剪该区域;
步骤1.3:应用预训练的DCNN(Dlib ResNet)提取裁剪后人脸的特征,并输出128维的特征向量作为该人脸的表征;
2)应用谱聚类实现对人脸表征的降维和聚类,操作步骤如下:
步骤2.1:以列矩阵形式表示人脸表征的集合X=(X1,X2,···,Xn),其中X为128维度的人脸表征,n为人脸的数目;
步骤2.2:基于高斯径向核函数构建邻接矩阵W和相似矩阵S,计算过程如下;
其中,各参数定义如下:
σ:径宽参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910663760.3/2.html,转载请声明来源钻瓜专利网。