[发明专利]一种虚假视频检测方法及系统在审
| 申请号: | 202111663688.8 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114332718A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 张敏;谢海永;吴曼青 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/80;G06V40/40;G06V40/16;G06V10/62;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张博 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 虚假 视频 检测 方法 系统 | ||
1.一种虚假视频检测方法,包括:
对待检测视频进行预处理,获取多个视频帧序列,其中,每个所述视频帧序列包括人脸图像;
通过处理单个视频帧序列获得所述待检测的视频的频域特征;
通过处理多个连续视频帧序列获得所述待检测的视频的时空特征;
将所述频域特征和所述时空特征进行融合,获得所述待检测视频的融合特征图;
利用视频分类网络处理所述融合特征图,得到表征待检测视频为真实或虚假的检测信息。
2.根据权利要求1所述的方法,其中,所述对待检测视频进行预处理包括:
利用视频处理工具处理所述待检测视频,获取视频帧序列集合;
从所述视频帧序列集合中随机选择多个视频帧序列,利用人脸检测工具获取所述视频帧序列的人脸图像部分;
利用所述人脸图像部分确定最小边界框,并根据预设的扩展值对所述最小边界框进行扩展,获得边框;
根据所述边框,利用图像裁剪工具对所述视频帧序列进行裁剪,获取包括人脸图像的多个视频帧序列。
3.根据权利要求1所述的方法,其中,通过处理单个视频帧序列获得所述待检测的视频的频域特征包括:
利用2D离散傅立叶变换处理所述单个视频帧序列,获取所述单个视频帧序列的频谱图;
构建频率带通滤波器,其中,所述频率带通滤波器包括低频率带通滤波器、中频率带通滤波器和高频率带通滤波器;
利用频率带通滤波器处理所述频谱图,获得频率分量,其中,所述频率分量包括低频分量、中频分量和高频分量;
将所述频率分量逆变换到空间域,获得图像分量,其中,所述图像分量包括低频图像分量、中频图像分量和高频图像分量;
将所述图像分量沿通道轴堆叠,获得堆叠图像;
构建基于通道注意力机制的图像分类网络,利用所述图像分类网络处理所述堆叠图像,获得所述频域特征。
4.根据权利要求3所述的方法,其中,所述2D离散傅立叶变换由公式(1)表示:
其中,M是所述单个视频帧的长度,N是所述单个视频帧的宽度,F(u,v)表示彩色图像的频谱,(u,v)表示频谱中的像素点位置坐标,(x,y)表示原始彩色图像的像素点位置坐标;
其中,所述频率带通滤波器由公式(2)表示:
其中,所述图像分量由公式(3)表示:
Ri,n(u,v)=Fi(u,v)·Bn(u,v) (3),
其中,Ri,n(u,v)表示图像分量。
5.根据权利要求3所述的方法,其中,所述图像分类网络采用ResNet152模型作为骨干网络,所述通道注意力机制采用SENet层,在所述ResNet152模型的残差分支上加入了SENet层;
其中,所述SENet层通过特征重标定操作对所述堆叠图像的频域特征进行增强或减弱。
6.根据权利要求1所述的方法,其中,所述通过处理多个连续视频帧序列获得所述待检测的视频的时空特征包括:
利用光流估计网络处理连续视频帧序列,获得光流矩阵;
利用所述光流矩阵,获得所述连续视频帧序列的短期时空特征;
利用长短期记忆人工神经网络处理所述光流矩阵,获得长期时空特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111663688.8/1.html,转载请声明来源钻瓜专利网。





