[发明专利]一种利用紧凑视频主题描述子进行视频检索的方法有效
申请号: | 201310255896.3 | 申请日: | 2013-06-25 |
公开(公告)号: | CN103279581A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 王亮;谭铁牛;黄永祯;赵放 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 紧凑 视频 主题 描述 进行 检索 方法 | ||
1.一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,其特征在于,该方法包括以下步骤:
步骤S1,将视频数据集中的部分视频作为视频训练集,剩下的视频作为视频测试集;
步骤S2,对所述视频数据集中的每一个视频提取其局部特征;
步骤S3,从提取得到的局部特征中随机抽取足够数量的局部特征,利用聚类算法训练得到一视觉词典,并利用该视觉词典对每一个视频的局部特征进行编码得到每个视频的词袋向量v;
步骤S4,将每一视频的词袋向量v建模为可见单元并作为主题模型的输入,将相应视频的主题描述子c建模为隐含单元并作为所述主题模型的输出,得到主题模型;
步骤S5,将所述视频训练集随机划分为多个子集,对于每一个子集分别计算所述主题模型的目标函数中的对数似然项和稀疏正则项对于可见单元的偏置参数a、隐含单元的偏置参数b和连接可见单元与隐含单元的权值W的梯度;
步骤S6,随机初始化偏置参数a、b和权值W的值,根据所述对数似然项和稀疏正则项对于偏置参数a、b和权值W的梯度,利用随机梯度下降法对偏置参数a、b和权值W分别进行更新直到所述主题模型的目标函数收敛到给定最小值或达到迭代停止条件,最后得到一个有稀疏约束的非负无向主题模型;
步骤S7,根据所述步骤S2和S3提取得到所述视频测试集中测试视频的词袋向量,并将所述测试视频和所述训练视频的词袋向量一并输入到所述步骤S6得到的有稀疏约束的非负无向主题模型中,利用隐含单元对可见单元的条件概率分别推断得到所述测试视频和训练视频的主题描述子;
步骤S8,分别计算所述测试视频的主题描述子与所述视频训练集中每一个训练视频的主题描述子之间的余弦距离,并根据所述余弦距离进行视频检索,得到与所述测试视频相似的视频。
2.根据权利要求1所述的方法,其特征在于,所述局部特征为尺度不变特征变换特征、空时兴趣点特征或梅尔倒频谱参数音频特征。
3.根据权利要求1所述的方法,其特征在于,所述聚类算法为K均值聚类算法。
4.根据权利要求1所述的方法,其特征在于,所述词袋向量v服从多项分布,所述主题描述子c服从非负高斯分布。
5.根据权利要求1所述的方法,其特征在于,所述步骤S4中,所述主题模型的目标函数为:
其中,W表示连接可见单元与隐含单元的权值,a和b分别为可见单元和隐含单元的偏置参数,P(vm)表示视频词袋向量vm的边缘概率,M表示视频训练集中视频的个数,λ为正则项系数,cm表示相应视频的主题描述子,其维度为F,E[cm|vm]表示给定词袋向量vm时主题描述子cm的条件均值,||·||1表示某一向量的L1范数,为对数似然项,为稀疏正则项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310255896.3/1.html,转载请声明来源钻瓜专利网。