[发明专利]一种基于注意力机制和混合网络的群体图像情绪识别方法有效
| 申请号: | 201910280721.5 | 申请日: | 2019-04-09 |
| 公开(公告)号: | CN110135251B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 邵洁;钱勇生;季欣欣;李晓瑞;莫晨;程其玉 | 申请(专利权)人: | 上海电力学院 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
| 地址: | 200090 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 混合 网络 群体 图像 情绪 识别 方法 | ||
1.一种基于注意力机制和混合网络的群体图像情绪识别方法,其特征在于,包括以下步骤:
步骤1:使用卷积网络模型以检测和提取图像中人的面部信息并输入面部CNN,通过注意力机制结合图像中的面部特征获取面部特征的单个表示;
步骤2:使用姿势估计方法获取图像中人体骨架信息并输入骨架CNN;
步骤3:利用数据库训练各分支网络模型;
步骤4:融合各个模型的预测结果,执行网络搜索以学习每个模型的权重;
步骤5:通过权重得出混合网络针对图像的最终识别结果,所述最终识别结果包括正面情绪、负面情绪或中性情绪;
所述的步骤1包括以下分步骤:
步骤11:使用多任务级联卷积网络模型获取图像中人的面部信息;
步骤12:将面部信息输入面部CNN;
步骤13:引入损失函数减轻过拟合;
步骤14:通过注意力机制找到图像中每个面部的概率权重并获得单个面部特征向量;
所述步骤12中的面部CNN采用ResNet18和SphereFace模型,其输入为96×112RGB对齐的人脸图像;
所述步骤3中的各分支网络模型还包括场景CNN,所述场景CNN的网络模型架构包括VGG19、ResNet101、SE-net154和DenseNet-161,所述场景CNN中还引入压缩和奖惩网络模块,其描述公式为:
s=σ(W2δ(W1z))
式中,zc为压缩通道的第c个元素,Fsq(.)为挤压函数,W和H为输入图像的宽度和高度,uc(i,j)为第i个通道第j个元素的输入,σ为sigmoid函数,δ为ReLU函数,z为压缩通道的所有压缩量,W1和W2表示升维层和降维层,s为奖惩量。
2.根据权利要求1所述的一种基于注意力机制和混合网络的群体图像情绪识别方法,所述步骤13中的损失函数为L-Softmax损失函数。
3.根据权利要求1所述的一种基于注意力机制和混合网络的群体图像情绪识别方法,所述步骤14中的单个面部特征向量,其描述公式为:
式中,Pd为单个面部特征向量,δi为权重,pi为面部特征向量。
4.根据权利要求1所述的一种基于注意力机制和混合网络的群体图像情绪识别方法,所述步骤2中的骨架CNN的网络模型架构包括ResNet101和SE-net154,所述步骤2中姿势估计方法采用OpenPose姿势估计方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力学院,未经上海电力学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910280721.5/1.html,转载请声明来源钻瓜专利网。





