[发明专利]一种基于字幕提取的新闻视频检索方法无效
申请号: | 201010599994.5 | 申请日: | 2010-12-22 |
公开(公告)号: | CN102331990A | 公开(公告)日: | 2012-01-25 |
发明(设计)人: | 章毅;彭德中;张蕾;吕建成;张海仙;郑伯川;郭泉 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N21/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 字幕 提取 新闻 视频 检索 方法 | ||
1.一种基于字幕提取的新闻视频检索方法,其特征在于,包括以下步骤:
步骤1 新闻镜头分割
采用时空切片的方法,提取视频的时空切片,检测镜头剪辑的位置,进行镜头分割;
步骤2 特殊镜头检测
根据对新闻视频结构信息的研究,对单个节目提取其结构支撑性镜头,训练一个或一组支持向量机,用该支持向量机对同一节目进行特殊镜头检测,以用于结构分析;
步骤3 新闻结构化分析
根据提取出的特殊镜头,将新闻进行结构化分析,并分组标记;
步骤4 镜头帧融合
对每个镜头进行最小值帧融合,减弱动态背景内容而增强固定的文本内容,得到融合帧;
步骤5 文本标题定位
由于文字区域的纹理特性表现为密集而同时有纵横纹理,对融合帧进行纹理分析,提取符合上述特征的区域,并提取最小矩形作为标题位置;
步骤6 字符识别
将提取出的字符区域进行二值化,交给字符识别模块,字符识别的结果作为提取出的标题字幕信息;
步骤7 建立标题字幕索引
将提取出的字符信息按照预先定义好的新闻结构存入数据库,同时利用索引模块进行数据库外部增量索引用于检索。
2.根据权利要求1所述的基于字幕提取的新闻视频检索方法,其特征在于,步骤1中具体方法为:
提取镜头的时空切片,对该时空切片进行边缘检测:令为时空切片的像素集合,对于,为时空切片边缘,即
通过形态学膨胀腐蚀操作检出纵向不连续标记为剪辑处以进行分割:用表示形态学膨胀操作,用表示形态学腐蚀操作,先使用形态学腐蚀操作,采用1*7的纵向矩形,去除不是纵向边缘的纹理,
,
然后扩展剩下的纵向纹理,通过5*3的矩形,进行形态学膨胀操作,
;
再次对膨胀后的纵向纹理提取边缘,以得到连通边缘,
,
再利用7*1的矩形进行形态学腐蚀操作,去除非横向纹理便可留下纵向纹理不连续处的纹理,
;
设定一个阈值对剩下的纹理进行判断,找到剪辑发生的地方,进行视频分割。
3.根据权利要求1所述的基于字幕提取的新闻视频检索方法,其特征在于,步骤4中具体方法如下:采用最小值融合法,对于镜头中的帧有
,
则为融合成的融合帧,该融合帧中动态背景内容被减弱,静态文本被加强。
4.根据权利要求1所述的基于字幕提取的新闻视频检索方法,其特征在于,首先通过边缘检测获得融合帧的纹理,
,
然后分别用1*3和3*1的核进行腐蚀操作分别取得纵向和横向的纹理,
,
.
然后通过与操作获取纵向纹理和横向纹理的连接部分,在此操作前,为了更容易找到这些连接,首先膨胀这些纵向和横向文理,分别采用4*7和7*4的核对两个纹理进行膨胀,
,
,
接着对膨胀后的两个纹理图像进行与操作以获得连接处的纹理,
.
最后,只需要提取纹理集中区域的边缘并计算可以包括此区域的最小矩形,即可获得标题文本的定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010599994.5/1.html,转载请声明来源钻瓜专利网。