[发明专利]一种基于MobileNetV3网络模型的红外人体行为识别方法在审
| 申请号: | 202011335991.0 | 申请日: | 2020-11-25 | 
| 公开(公告)号: | CN112396012A | 公开(公告)日: | 2021-02-23 | 
| 发明(设计)人: | 卢新彪;徐嘉雯 | 申请(专利权)人: | 江苏新安电器股份有限公司 | 
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 | 
| 代理公司: | 苏州圆融专利代理事务所(普通合伙) 32417 | 代理人: | 郭珊珊 | 
| 地址: | 215000 江苏省*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 mobilenetv3 网络 模型 红外 人体 行为 识别 方法 | ||
本发明公开了一种基于MobileNetV3网络模型的红外人体行为识别方法,包括以下步骤:S1:室内拍摄红外视频;S2:选择多人参与拍摄,实施动作分别为:坐、立、躺、行走、奔跑、跳跃;S3:共拍摄230个小视频,将230个小视频切帧成62806张图像,帧率为30fps;S4:分成6类数据集的同时,划分数据集为88%训练集,10%验证集,2%测试集;S5:生成训练和验证txt标签文件并生成7个record文件方便送入网络;S6:送入神经网络训练;S7:模型预测,实现动作的识别与预测。本发明,使用轻量级的神经网络模型MobileNetV3,减少参数和计算量的同时,提高精确度,后期可以使用在各类移动端包括手机、嵌入式设备例如jetson nano等设备上。
技术领域
本发明涉及深度学习技术领域,具体是一种基于MobileNetV3网络模型的红外人体行为识别方法。
背景技术
人体行为识别是目前计算机视觉范畴的重要研究,在视频监控、智能家居、人机交互等众多方面有着广泛的应用,不仅具有重要的科学意义,也有十分关键的实用价值。
人体行为识别是从传感器、视频等工具中获取数据来源,形成可参考的数据库,以供后面的网络进行学习。传感器数据主要是由加速度计、陀螺仪等采集人体在不同动作时的加速度和角速度数据,形成一维数据;视频数据又分为多种,网上可供下载的数据集包括:传统视频数据集比如来自32部电影的Hollywood数据集、UCF系列数据集;跨视角数据集包括IXMAS数据库、NUMA数据库等;跨光谱数据集例如高陈强教授团队所拍摄的红外热像仪数据集、KTH红外数据集等。
数据集是人体行为识别中重要的数据来源,网络模型的选择也非常关键。深度学习中用于图像分类的神经网络模型很多,经典的模型AlexNet、VGG系列网络、GoogLeNet系列、ResNet以及DenseNet等。AlexNet使用了非线性激活函数ReLU,添加防止过拟合的多种方法,多GPU实现并使用了LRN归一化层,使得卷积神经网络成为图像识别分类的核心算法模型,带来了深度学习的大爆发,是具有历史意义的一个网络结构;VGGNet构筑了16~19层深的卷积神经网络,证明了增加网络的深度能够在一定程度上影响网络最终的性能,使错误率大幅下降,同时拓展性又很强,迁移到其它图片数据上的泛化性也非常好。到目前为止,VGG仍然被用来提取图像特征。GoogLeNet深度只有22层,大小比AlexNet和VGG小很多,参数为500万个,AlexNet参数个数是GoogleNet的12倍,VGGNet参数又是AlexNet的3倍,因此在内存或计算资源有限时,GoogleNet是比较好的选择。从模型结果来看,GoogLeNet的性能也更加优越。ResNet模型是卷积神经网络史上的里程碑事件,深层次的网络使得训练的准确度更高;DenseNet模型的基本思路与ResNet一致,不同的是它建立的是前面所有层与后面层的密集连接(dense connection),通道连接进而实现特征重用,性能更优。
不断增加网络的深度可以提高网络的性能,但随着网络层数的不断增加,会带来两个主要的问题:一是过拟合,训练数据不足;二是计算资源的浪费,因为网络中大量神经元激活函数的输出最后会变为零。因此本专利选择Google公司在2019年新推出的MobilenetV3,该网络模型是一个轻量级的网络,参数量更少,网络的大小也就相应减少;另外,计算量也相应减少,网络的效率也就更高,并只损失了少量的精度。
发明内容
本发明的目的在于提供一种基于MobileNetV3网络模型的红外人体行为识别方法,以解决现有技术中的问题。
为实现上述目的,本发明提供如下技术方案:一种基于MobileNetV3网络模型的红外人体行为识别方法,包括以下步骤:
S1:室内拍摄红外视频;
S2:选择多人参与拍摄,实施动作分别为:坐、立、躺、行走、奔跑、跳跃;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏新安电器股份有限公司,未经江苏新安电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011335991.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音频输出模式调整方法、装置及电子设备
- 下一篇:一种智慧教室用广播系统及方法





