[发明专利]一种用于具有长尾分布特性的单猴视频动作分类方法在审
申请号: | 202210254527.1 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114596590A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 朱磊;范文萱 | 申请(专利权)人: | 北京信智文科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V40/20;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律谱知识产权代理有限公司 11457 | 代理人: | 黄云铎 |
地址: | 101300 北京市顺义*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 具有 长尾 分布 特性 视频 动作 分类 方法 | ||
1.一种用于具有长尾分布特性的单猴视频动作分类方法,其特征在于,所述单猴视频动作分类方法包括以下步骤:
步骤1,构建猴子的动作数据集;
步骤2,通过数据集对深度神经网络进行训练,构建单猴视频动作分类模型;
步骤3:对模型进行评估,判定模型的稳定性和泛化能力;
步骤4:分析分类效果,如果效果不理想可以回到步骤2中进一步训练以得到性能更好的模型;
在步骤S2中,还包括以下步骤:
步骤21,输入符合长尾分布的动作数据集,不进行类平衡采样,直接输入深度神经网络训练进行特征提取;
步骤22,深度神经网络通过线性分类器进行分类;
步骤23,对分类器的参数进行归一化得到最终的分类模型。
2.根据如权利要求1所述单猴视频动作分类方法,其特征在于,在步骤1中,所述动作数据集中第i个数据为Xi={xi,yi},其中,xi为第i个视频,yi为第i个视频的标签即类别,记nk为第k类视频的个数,是所有类别视频的总数。
3.根据如权利要求1所述单猴视频动作分类方法,其特征在于,在步骤S21中,所述特征为:
f(x;θ)=z
其中x为输入的视频数据,θ为深度神经网络参数,z为提取的特征向量。
4.根据如权利要求3所述单猴视频动作分类方法,其特征在于,在步骤S22中,所述线性分类器为:
g(z)=WTz+b
其中,W为分类器的参数,b为偏置,g(z)表示预测结果,z为提取的特征向量。
5.根据如权利要求4所述单猴视频动作分类方法,其特征在于,在步骤S23中,所述分类器的参数为:
W={wj}∈Rd×c
其中,wj是第j类视频数据的权重参数,C表示视频类型的总数量,模型分类器类别的数量与视频类型的数量相同;
对W进行归一化得到:
其中,τ是归一化参数的超参量,取值在0~1之间,‖·‖指L2范数。
6.根据如权利要求1所述单猴视频动作分类方法,其特征在于,在步骤S3中,对模型头部、中部和尾部类别的均值平均精度mAP进行估计:
其中,C表示视频类型的总数量,APi为第i类视频的PR曲线下的面积。头部类别指样本数超过500的类别,中部类别指样本数超过100少于500的类别,尾部类别指样本数少于100的类别。
7.根据如权利要求1所述单猴视频动作分类方法,其特征在于,在步骤S3中,对模型中预测结果排名第一的类别与实际结果相符的准确率进行评估:
其中,Numtop1_correct为预测结果排名第一且正确预测的视频样本数目,Numall为测试的样本总数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信智文科技有限公司,未经北京信智文科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210254527.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模型训练请求的调度方法及装置
- 下一篇:诊断教学方法、设备