[发明专利]一种基于注意力机制多尺度网络的自然场景情绪识别方法在审

申请号：	202011280735.6	申请日：	2020-11-16
公开（公告）号：	CN114511895A	公开（公告）日：	2022-05-17
发明（设计）人：	卿粼波;晋儒龙;何小海;陈洪刚;文虹茜	申请（专利权）人：	四川大学
主分类号：	G06V40/16	分类号：	G06V40/16;G06V40/20;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	610065 四***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于注意力机制尺度网络自然场景情绪识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于注意力机制多尺度网络的自然场景情绪识别方法，主要涉及人物和场景线索融合的情绪识别。本发明本发明主要包括：对于人物分支，提取特征同时加入姿态注意力机制，该分支能有效挖掘人物本身的情绪状态；对于场景分支，使用多尺度网络增强场景中局部细节特征，融合空间注意力模型自动关注场景中对情绪识别有效的区域。本发明充分利用人物与场景各自的优势进行情绪识别，提高了情绪识别的精确率。

技术领域

本发明属于情绪识别领域，具体涉及一种基于注意力机制多尺度网络的自然场景情绪识别方法。

背景技术

情绪识别是计算机视觉的一项基本任务，它是情感计算的一部分，旨在识别出某个体的感受与状态，例如高兴、悲伤、厌恶、惊喜等等。情绪识别技术用途广泛，目前已经在人机交互、安防、医疗健康等领域有所应用。

针对情绪识别的研究，无论是传统的手工提取特征，还是深度学习方法，多数研究都是关注于面部特征，因其能够提供最明显直观的情感状态。研究发现，声音、文本、姿态以及身体物理信号(心跳变化，瞳孔放大程度等)等也能辅助识别情绪，因此也有学者融合多模态信息来提高情绪识别的准确性。然而在自然场景中，基于视觉信息仍是主要的情绪识别方法，但也存在相应的挑战。首先，自然场景中人脸通常存在光照不均匀、遮挡、拍摄角度等问题，导致难以直接识别其情绪状态；其次，同一种行为处于不同场景会出现不同的情绪状态，例如在办公室浏览电脑与在家中浏览电脑可能是两种不同的情绪状态。

综上所述，如何有效地结合场景与人物的关系，克服上述现有技术所存在的缺陷是本技术领域亟待解决的问题。

发明内容

鉴于现有技术存在的不足，本发明的目的是提出一种基于注意力机制多尺度网络的自然场景情绪识别方法，充分结合人物与场景的信息，能够有效提高情绪识别的精确率。其特征在于，包括如下步骤：

a.将人物图像以及去除人物的场景图像送入双分支网络进行训练；

b.在上述a中双分支网络，第一分支输入人物图像，使用特征提取网络和姿态注意力机制得到人物特征，第二分支输入场景图像，使用多尺度网络和空间注意力模型提取图像的全局特征；

c.对上述b中的双分支网络进行融合分类，最终得到情绪识别的结果；

该方法主要包括以下步骤：

(1)静态图像I通过人物边界框处理为人物图像I_B以及去除人物的场景图像I_C，计算公式为：其中bbox_IB表示主要人物所在区域；

(2)I_B送入第一分支的卷积层，池化层，全连接层进行特征提取，得到个体的特征向量f_B’，同时I_B经过姿态注意力机制得到个体的情绪置信度λ；

(3)I_C送入第二分支通过多尺度网络得到场景的特征向量f_C1，多尺度网络中的特征图通过空间注意力模型，得到特征向量f_C2；

(4)对上述(2)和(3)得到的特征向量进行进行融合与分类，得到最终的情绪识别的结果。

与现有技术相比，本发明的优点主要体现在以下几个方面：