[发明专利]视频标记方法和装置有效
申请号: | 201410268811.X | 申请日: | 2014-06-17 |
公开(公告)号: | CN105185397B | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 谢晓辉;蔡振华;傅静静 | 申请(专利权)人: | 北京司响无限文化传媒有限公司 |
主分类号: | G11B27/10 | 分类号: | G11B27/10;G11B27/031 |
代理公司: | 北京律和信知识产权代理事务所(普通合伙) 11446 | 代理人: | 王美石;刘国伟 |
地址: | 100027 北京市东城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 标记 方法 装置 | ||
本发明涉及视频标记方法和装置,其方法包括:对标记进行编码,其中,所述标记与对视频进行描述的描述信息和位置相对应;将编码后的标记转换成音频文件;以及根据所述位置,将所述音频文件插入所述视频中。本发明提供的基于声音编码来标记视频的技术,可以有效地对视频进行标记,经标记的视频只有一个文件,不会有描述信息文件丢失造成视频无标记、无法整理、检索和/或获取的问题,并且标记后的视频连续性强,重新剪辑、编辑或删除部分视频内容都不会影响对视频文件的标记。
技术领域
本发明总地涉及视频处理,具体地说,涉及一种对视频进行标记的方法和装置。
背景技术
近年来,可观看的视频节目数量显著增长,能对数量日益庞大的视频节目进行整理、归纳和检索成为非常重要的工作,为此,需要对视频进行描述。视频标记是一种将描述信息与视频内容关联起来的技术。有了这样的技术,可以对视频节目中携带的人物、物品、事件、声音、文字等进行描述,从而便于视频的分类、整理、检索、分发和获取。
目前,常用的视频标记方式是,将描述视频内容的信息存储成文本文件的格式,并给标记相应视频信息的时间戳。这种视频标记方式分别提供了视频文件和描述信息的文本文件,在播放视频文件时,根据时间戳来读取文本文件中的描述信息。例如,在给电影加字幕或者旁白时,现有的做法是,将字幕或旁白制作成文本文件,并根据字幕或旁白在电影播放过程中出现的时间点加上适当的时间戳。这样,在播放电影的视频内容时,播放器通过时间戳指示的时间读取相应的字幕或旁白,在图像上呈现出合适的字幕或旁白。
按照这种标记方式,视频文件和描述信息是分离的两个文件,极易导致二者之间的不匹配,甚至描述信息丢失,造成对视频描述的无效。再者,如果对视频文件进行了剪辑或重新编辑,那么必须对相应的描述信息进行修改;否则,由于时间上的不对准,必然会造成视频文件与描述信息之间的不匹配。这也是我们常常看到电影与其对白对不上的原因之一。
此外,由于视频文件和用于标记它的文件是两个分离的文件,这也给视频整理、检索和获取造成了不少的麻烦和不小的困难。
当前的视频标记方式存在着操作复杂、连续性不强、标记效果不明显的问题。因此,如何提高视频标记性能成为一个亟待解决的技术问题。
发明内容
有鉴于此,本发明提供一种基于声音编码来标记视频的技术,可以有效地对视频进行标记,经标记的视频只有一个文件,不会有描述信息文件丢失造成视频无标记、无法整理、检索和/或获取的问题,并且标记后的视频连续性强,重新剪辑、编辑或删除部分视频内容都不会影响对视频文件的标记。
根据本发明的一方面,一种视频标记方法包括:
对标记进行编码,其中,所述标记与对视频进行描述的描述信息和位置相对应;
将编码后的标记转换成音频文件;以及
根据所述位置,将所述音频文件插入所述视频中。
其中,将所述标记表示成2字节无符号整数、或8字节无符号整数、或16字节无符号整数。
一方面,所述将编码后的标记转换成音频文件的步骤包括:
将编码后的标记转换成比特流;
利用扩频序列,将所述比特流进行直接序列扩频基带调制;
对所获得的直接序列扩频基带调制信号进行低通滤波和正交调制,以获得中心频率是期望频率的音频信号;
对所述音频信号进行采样和量化,以获得数字信号;以及
将所述数字信号写成音频文件。
其中,可以将数字信号写成WAV格式且时长与原视频时长相同的音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京司响无限文化传媒有限公司,未经北京司响无限文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410268811.X/2.html,转载请声明来源钻瓜专利网。