[发明专利]一种新闻视频字幕标注方法有效
申请号: | 201210106534.3 | 申请日: | 2012-04-12 |
公开(公告)号: | CN102780856A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 刘赵杰 | 申请(专利权)人: | 天脉聚源(北京)传媒科技有限公司 |
主分类号: | H04N5/278 | 分类号: | H04N5/278;G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100007 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 视频 字幕 标注 方法 | ||
技术领域
本发明涉及视频内容分析技术领域,尤其涉及一种新闻视频字幕标注方法。
背景技术
随着信息时代的发展,视频资料的增多,日益呈现海量化的规模。视频内容同其它类型内容相比,具备更为生动的展现形式,承载了更为丰富的信息。为了实现对视频信息的高效访问,方便人们对其高效浏览和检索,视频处理和检索工具的研制成为当务之急。视频是集图像、声音、文字为一体的,其中视频中的字幕是视频高层语意内容的一个重要来源,如新闻的标题、内容提示信息、播出时的时间、旁白、节目后的致谢和工作人员名单等都包含了丰富的高层语意信息。提取视频中的字幕信息对大量视频的自动化管理,对利用成熟的文本检索技术进行视频检索具有重要的意义。
新闻视频作为视频数据中最具有代表性的媒体之一,广泛地受到人们的关注。而随着新闻视频数据的大量而快速地增加,导致了人们迫切需要一个快速、有效的基于内容的浏览和检索系统。在新闻视频中字幕具有明确、丰富的信息,有助于人对新闻视频语义内容的理解,是新闻视频语义信息获取的一条重要途径。同时还为新闻视频索引和视频分类提供了重要的信息,因此新闻视频字幕的自动检测具有重要意义。新闻视频中出现的字幕主要有下面几种形式:新闻的标题,重要信息提示字幕(新闻记者,新闻的地点和新闻中人物地点的提示),语音提示字幕和滚动的实时信息提示。这些字幕中滚动的实时信息提示字幕可能与新闻本身关系不大,其他都对新闻的标注有重要的作用。
传统的新闻视频中字幕的标注方法一般有两种,一是人工标注,就是通过采用简单的标注工具,通过标注人员对新闻视频反复浏览,找出新闻视频中出现的字幕信息,对其中的重要信息进行简单的标注。二是通过计算机程序自动对新闻视频字幕检测和识别,对新闻视频中的全部字幕进行统一处理,然后由人工对识别的结果进行校正。程序提取新闻视频字幕一般是通过对视频解码,通过对视频帧进行分析,比如采用基于连通域的方法,基于纹理的方法,基于边缘的方法或基于对字幕块特征建立分类器的方法对视频中的字幕进行定位,然后对定位的字幕块进行识别,最后识别的结果由人工进行确认形成统一格式的视频内容文本信息标注结果。
现有的字幕标注技术没有考虑到新闻视频的特点,新闻视频一般都有标准格式或自己固定的格式,而且这个格式一般也很长时间都不会更新。这些格式一般包括新闻标题的位置,字体颜色大小,背景的颜色等都固定,还有其中的提示字幕也固定位置或横竖方向等。通用的字幕标注技术中没有对这些类型加以区分,只要是新闻中出现的字幕,系统都会自动定位识别。让这些字幕的信息量的等级没有区分,从而降低了字幕所提供的信息量。这样的标注不利于人工后期的校对也不利于视频信息的检索,当然也更不利于读者对这些新闻视频的浏览。
人工标注的方式能保证信息的准确,但是人工标注的销量低下,成本高,而且所能提取的信息有限。同时随着数据量上飞速的增长,这种方式的让标注变成不可接受的方式。计算机程序自动定位识别然后辅助人工校对的方法,在视频字幕提取方法中,基于连通域能快速定位字幕区域,但对背景复杂度敏感;基于纹理算法实现简单,但是由于视频中相近纹理区域影响使得检测的准确率低;基于边缘的方法计算复杂度低,但很依赖视频字幕的背景;还有一些基于统计建立分类器的方法,太依赖于训练样本。现有的视频字幕处理方法中都存在各自的问题,很难找到一种方法能应对目前新闻视频的情况。而且现有的系统没有充分利用新闻视频的特点,仅从一个通用的视频字幕标注考虑,泛发型不好还有没有考虑到视频中字幕的不同类型。结果导致视频字幕自动定位和识别的效果很不理想,导致最后人工校对的工作量增加,从而增大了标注的成本。
发明内容
本发明的目的在于提出一种新闻视频字幕标注方法,能够提高视频中字幕标注的准确率,减少人工校对的时间,提高对新闻视频检索的效果。
为达此目的,本发明采用以下技术方案:
一种新闻视频字幕标注方法,包括以下步骤:
A、采集新闻视频;
B、对所述新闻视频进行解码,获得单帧的视频图像;
C、从所述视频图像中提取候选字幕区域,进行新闻字幕区域定位;
D、将所述新闻字幕区域与新闻模板库中的模板图像进行匹配,如果匹配,则转至步骤E,如果不匹配,则转至步骤F;
E、按照模板图像标注格式对所述新闻字幕区域进行标注;
F、对所述新闻字幕区域进行标注。
步骤F进一步还包括以下步骤:
将对所述新闻字幕区域的标注结果存储到新闻模板库中。
步骤A中,采用电脑和电视卡的方式采集新闻视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天脉聚源(北京)传媒科技有限公司,未经天脉聚源(北京)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210106534.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:下阻尼器活动拨块水平运动结构
- 下一篇:自清洁百米牌