[发明专利]一种基于文件传输的人脸表情识别方法及系统有效
申请号: | 201710257046.5 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107133578B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 邓诗雨;刘龙至;张伟彬;李嘉恒;林泽宏;肖玉可;刘梓熙 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文件传输 表情 识别 方法 系统 | ||
1.一种基于文件传输的人脸表情识别方法,其特征在于,包括以下步骤:
训练阶段:
S1:获取并整合人脸表情图库,将所述人脸表情图库分为开心、中性、愤怒、悲伤、惊恐和厌恶这六类表情;
S2:对整合分类完的人脸表情图库进行预处理;
S3:把预处理后的人脸表情图库分为训练集和测试集两部分;将分类好的训练集和测试集分别提取文件名,并分别标记为0~5,分别代表上述六类表情;再将训练集与测试集分别转为LMDB格式;
S4:将训练集图像用于深度卷积神经网络的训练;
所述深度卷积神经网络采用交叠的池化方式:交替采用最大池化及平均池化;
在所述深度卷积神经网络中加入了dropout单元,dropout在模型训练时随机地让网络某些隐含层节点的权重不工作;
深度卷积神经网络中对于同层的相邻结点的响应进行局部归一化,采用了局部响应归一化层;
S5:将测试集图像用于模型的测试,得到端对端模型;
修改训练的深度卷积神经网络,将数据层输入的LMDB类型的数据改为用dim参数描述的数据输入;将训练的深度卷积神经网络网络的输出层Softmax With Loss改为Softmax,训练时输出的是loss,测试时改为输出prob;
S6:将表情识别的端对端模型封装成分类器,实现直接输出最终识别的表情类别及其对应的概率;
识别阶段:
S7:用户上传一张人脸表情图像到文件传输客户端;
根据客户端提供的标准用户界面,输入recog命令后回车执行,该命令将图片上传到服务器的指定目录下,生成临时文件和后期所需要的文件;
S8:服务器后台自动对输入图像进行预处理;
S9:系统将预处理后的图像与提前训练得到的卷积神经网络模型进行特征匹配,将人脸表情识别结果以文本文件的形式输出;
把测试后得到的识别结果及其对应的概率写入指定文件中,然后从该指定文件读取结果通过TCP/IP协议栈传输给客户端,客户端通过界面上的输出查看结果。
2.根据权利要求1所述的基于文件传输的人脸表情识别方法,其特征在于,步骤S2中预处理的方法包括:将图库中的彩色图像转换为256个灰度级的灰度图像,将所述灰度图像人脸部分框出,并进行截取与平移,使人脸位居于图像正中央;将所有经过平移调整的灰度图像进行大小变换,统一转为256*256像素。
3.根据权利要求1所述的基于文件传输的人脸表情识别方法,其特征在于,深度卷积神经网络训练时,学习率采用“step”的策略,初始学习率为0.0001,每训练6000次,学习率减小0.00001;训练网络最大迭代50000次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710257046.5/1.html,转载请声明来源钻瓜专利网。