[发明专利]基于组示多示例学习模型的视频特定包含语义检测方法有效
| 申请号: | 201110087415.3 | 申请日: | 2011-04-08 |
| 公开(公告)号: | CN102156686A | 公开(公告)日: | 2011-08-17 |
| 发明(设计)人: | 蒋兴浩;孙锬锋;沈楚雄;吴斌;张善丰;储曦庆;樊静文 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F15/18 | 分类号: | G06F15/18;G06K9/62;H04N5/262 |
| 代理公司: | 上海交达专利事务所 31201 | 代理人: | 王锡麟;王桂忠 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 组示多 示例 学习 模型 视频 特定 包含 语义 检测 方法 | ||
1.一种基于组示多示例学习模型的视频特定包含语义检测方法,其特征在于,包括以下步骤:
第一步:对视频按镜头进行连续分割,得到若干视频片段;
第二步:使用ffmpeg工具,对每一个视频片段Sij,平均每段视频在相同的时间间隔中截取25张图片,用来截取图像描述子;
第三步:使用视频的音频轨道提取有关音频的描述子,使用视频的截图组截取视频描述子,使用视频本身截取运动程度;
第四步,对于每一组描述子,对其进行机器学习;
第五步:前一步得到了经过机器学习之后的结果,将该学习结果与每一个目标视频的某一描述子进行欧式距离的计算,将所得到的最小值作为目标视频在该描述子的描述下,与源视频的接近程度。
2.根据权利要求1所述的基于组示多示例学习模型的视频特定包含语义检测方法,其特征是,所述的第一步,具体步骤包括:
1.1)将源视频组重新命名,对其中的第i个场景命名为Vi;
1.2)目标视频重新命名为T;
1.3)格式化视频,使用ffmpeg工具,使得源视频组和目标视频都转化为25帧每秒的avi格式视频;
1.4)根据镜头的连续性,将源视频组Vi和目标视频T都按照镜头的连续性分割,当被分割的数据段不到一秒,将该视频数据与前一个镜头合并;该步所得到的视频,重命名为Sij。
3.根据权利要求2所述的基于组示多示例学习模型的视频特定包含语义检测方法,其特征是,所述的源视频组,为选定的基础视频组,这些视频包含了相似的内容,根据这些视频来判断目标视频是不是包含同样的内容;所述的目标视频,为未知内容的一个视频,该视频将会被用来判断与源视频组在内容上的相关性以及相似性,从而确定该视频在内容上包含什么样的内容。
4.根据权利要求1所述的基于组示多示例学习模型的视频特定包含语义检测方法,其特征是,所述的描述子为Di,1≤I≤n,通过标准MPEG描述子生成软件提取,该描述子使用等长的向量来表示,一个描述子表示为一个n维空间中的一个点。
5.根据权利要求1所述的基于组示多示例学习模型的视频特定包含语义检测方法,其特征是,所述的第四步具体步骤包括:
4.1)将提取的描述子向量作为正包数据,随机生成描述子向量作为反包数据,将随机10%的正包数据描述子向量作为起始点,计算通过这些起始点,正包数据,反包数据,调用LR-MD-EMDD算法,能够得到一组源视频的特征点;该特征点集为改组视频所包含的共同特征;
4.2)输出为对于每一个特征Fi(Feature)所对应的特征点集(Point Set)Xi(1≤I≤20)的欧氏距离Di,对于每个Di,对应的一个权重μi;
4.3)系统存储该数据,为下一步作比对。
6.根据权利要求5所述的基于组示多示例学习模型的视频特定包含语义检测方法,其特征是,所述的正包数据是指:符合特征视频按照该特征出现的程度大小来打分,并标记为正包数据;所述的反包数据是指:多种已经标记了的视频的描述子,标记指的是将不符合某种特征的视频。
7.根据权利要求1所述的基于组示多示例学习模型的视频特定包含语义检测方法,其特征是,所述的第五步具体步骤包括:
5.1)对应有n个描述子;取10%的正包数据的特征点为起始点,调用EMDD算法,计算第i个描述子的最大分布密度点集;该点集表示为maxDDj[k];
5.2)对于第i个示例的第j个特征点Xij,计算该特征点与该特征空间最大分布密度点集的欧氏距离,这些距离的最小值为:
其中,dij表示xij与最大多样性密度点之间的欧氏距离;
5.3)确定K,定义Aj(AverageValue)为最小的k个dij的平均值,k=1;对于第i个示例组(Grouped Instance),定义一个变量Di,定义为:
其中:μ={μ1,...,μN}为权重系数,通过最大拟合,选定μi使得该值在进行测试检验时能够使得整个测试集;
5.4)重复步骤5.1-步骤5.3若干次,调整变量maxDDj[k],μj使得多次的平均错误最小,输出为:dij,μi。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110087415.3/1.html,转载请声明来源钻瓜专利网。





