[发明专利]基于多域视觉特征的新闻图像检测方法及系统、装置在审
申请号: | 201911018018.3 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110889430A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 曹娟;谢添;郭俊波;刘浩远 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;张燕华 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 特征 新闻 图像 检测 方法 系统 装置 | ||
1.一种基于多域视觉特征的新闻图像检测方法,其特征在于,包括:
提取新闻图像在各频域上的频域向量,获取该频域向量在对应频域上的频域特征,并将该频域特征拼接为该新闻图像的物理视觉特征;
获取该新闻图像在各语义上的语义特征,将该语义特征的正向GRU特征序列和反向GRU特征序列,拼接为该新闻图像的语义视觉特征;
将该物理视觉特征和该语义视觉特征进行融合及逻辑回归分类,以获取该新闻图像为虚假新闻图像类别的预测概率。
2.如权利要求1所述的新闻图像检测方法,其特征在于,获取该物理视觉特征的过程具体包括:
以卷积神经网络构建频域网络;
对该新闻图像进行离散余弦变换处理,以获得该新闻图像对应64个频域上对应的DCT系数直方图;
对所有该DCT系数直方图进行一维傅里叶变换并采样,获得64个250维的频域向量{h0,h1,……,h63};
通过该频域网络获得频域向量{h0,h1,……,h63}对应的频域特征{w0,w1,……,w63};
将频域特征{w0,w1,……,w63}拼接为该物理视觉特征{l0}。
3.如权利要求2所述的新闻图像检测方法,其特征在于,获取该语义视觉特征的过程具体包括:
以卷积神经网络和循环神经网络构建像素域网络;
通过该像素域网络对该新闻图像进行由局部语义到全局语义表示的逐层抽象的特征提取,以获得语义特征{v1,v2,v3,v4},其中,v1为该新闻图像的线条特征,v2为该新闻图像的颜色特征,v3为该新闻图像的纹理特征,v4为该新闻图像的物体特征;
以GRU网络获取语义特征{v1,v2,v3,v4}的正向GRU特征序列和反向GRU特征序列其中,t∈[1,4];
将和拼接为该语义视觉特征{l1,l2,l3,l4},其中,t∈[1,4],l1为线条视觉特征,l2为颜色特视觉特征,l3为纹理视觉特征,l4为物体视觉特征。
4.如权利要求3所述的新闻图像检测方法,其特征在于,获取该预测概率的过程具体包括:
通过注意力机制对该物理视觉特征{l0}和该语义视觉特征{l1,l2,l3,l4}进行特征价值增强,并融合为该新闻图像的特征向量表示u;其中,i∈[0,4],αi为li的归一化权重;
通过具有Softmax激活的全连接层将特征向量表示u投影到两类目标空间,并获取该预测概率p,其中,该两类目标空间包括虚假新闻图像类别和真实新闻图像类别。
5.一种基于多域视觉特征的新闻图像检测系统,其特征在于,包括:
频域特征提取模块,用于提取新闻图像在各频域上的频域向量,获取该频域向量在对应频域上的频域特征,并将该频域特征拼接为该新闻图像的物理视觉特征;
像素域特征提取模块,用于获取该新闻图像在各语义上的语义特征,将该语义特征的正向GRU特征序列和反向GRU特征序列,拼接为该新闻图像的语义视觉特征;
融合预测模块,用于将该物理视觉特征和该语义视觉特征进行融合及逻辑回归分类,以获取该新闻图像为虚假新闻图像类别的预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911018018.3/1.html,转载请声明来源钻瓜专利网。