[发明专利]新闻视频自动分条装置及新闻视频自动分条的方法有效
申请号: | 201310032025.5 | 申请日: | 2013-01-25 |
公开(公告)号: | CN103079041A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 朱定局 | 申请(专利权)人: | 深圳先进技术研究院;深圳市天华世纪传媒有限公司;深圳市天威视讯股份有限公司 |
主分类号: | H04N5/262 | 分类号: | H04N5/262 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 视频 自动 装置 方法 | ||
技术领域
本发明涉及视频处理,尤其涉及一种新闻视频自动分条装置及新闻视频自动分条的方法。
背景技术
目前新闻拆分要么是纯手工拆分,要么是根据新的主题新闻开始时,刚开始的几帧一般都静音,来进行拆分。
手工拆分一个长度为N分钟的新闻视频,往往需要数倍于N分钟的时间,人工成本太高,拆分速度太慢。
根据“新的主题新闻开始时,刚开始的几帧一般都静音”来拆分,往往把同一个主题新闻中镜头的切换切分为了不同的主题新闻,因为只要是镜头切换,都可能导致“刚开始的几帧一般都静音”,所以这种技术虽然比纯手工拆分好,但在用这种技术进行初次切分后,还是需要人工进行大量的纠错工作。
发明内容
有鉴于此,有必要提供一种对新闻视频自动分条、节省人工成本的方法。
本发明提供的新闻视频自动分条装置,包括提取模块、特征识别模块、判断模块以及拆分模块。其中,提取模块,用于自动提取新闻视频中所有的静音帧;存储模块,用于预先存储播报员的声音以及头像,并存储静音帧及其时间点;特征识别模块,用于根据所述播报员的声音特征提取新闻视频中含有播报员声音的帧以及根据所述播报员头像提取新闻视频中含有播报员头像的帧;判断模块,用于判断新闻视频中的所述静音帧是否为包含播报员头像的帧,其中,所述判断模块还用在所述静音帧为包含播报员头像的帧时判断所述静音帧之后的帧是否包含播报员的头像与声音;拆分模块,用于在所述静音帧之后的帧包含播报员头像与声音时将所述静音帧设为起始帧,并从所述起始帧对应的时间点对新闻视频进行拆分。
本发明还提供一种新闻视频自动分条的方法,包括以下步骤:提取所述新闻视频中的静音帧;读取新闻视频的播报员的声音特征;根据所述播报员的声音特征提取新闻视频中含有播报员声音的帧;读取新闻视频中含有播报员头像的帧;根据所述播报员头像提取新闻视频中含有播报员头像的帧;判断所述静音帧中是否为包含所述播报员头像的帧;若是,则判断所述静音帧之后的帧中是否包含播报员声音与头像;若是将所述静音帧设为起始帧,并从所述起始帧对应的时间点对新闻视频进行拆分。
本发明提供的新闻视频自动分条装置及新闻视频自动分条的方法通过对静音帧、包含播报员头像帧以及包含播报员声音帧综合判断来得到起始帧及其对应的时间点,以便对新闻视频进行拆分,有效的提高了新闻视频的拆分效率,减低了人工的工作量。
附图说明
图1为本发明一实施方式中新闻视频自动分条装置的模块图;
图2为本发明一实施方式中新闻视频自动分条方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,术语“内”、“外”、“纵向”、“横向”、“上”、“下”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不能理解为对本发明的限制。
请参阅图1,图1所示为本发明一实施方式中新闻视频自动分条装置10的模块图。
在本实施方式中,新闻视频自动分条装置10包括:获取模块102、特征识别模块104、判断模块106、拆分模块108、处理器110以及存储模块112,获取模块102、特征识别模块104、判断模块106以及拆分模块108存储在存储模块112中,处理器110用于执行存储模块112中的各个模块。
在本实施方式中,提取模块102用于自动提取新闻视频中所有的静音帧。
存储模块112用于预先存储播报员的声音以及头像,并存储静音帧及其时间点。
特征识别模块104用于根据所述播报员的声音特征提取新闻视频中含有播报员声音的帧以及根据所述播报员头像提取新闻视频中含有播报员头像的帧。
在本实施方式中,所述存储模块112将含有静音帧的时间点存储为静音集合B={B1,B2,...,Bn},将播报员的声音的帧的时间点存储为声音集合C={C1,C2,...,Cm}以及含有播报员的头像的帧的时间点为头像集合D={D1,D2,...,Dk}。
在本实施方式中,所述播报员与所述播报员的声音是一一对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院;深圳市天华世纪传媒有限公司;深圳市天威视讯股份有限公司,未经深圳先进技术研究院;深圳市天华世纪传媒有限公司;深圳市天威视讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310032025.5/2.html,转载请声明来源钻瓜专利网。