[发明专利]从数字视频文件搜索和提取数字图像有效
| 申请号: | 201010500840.6 | 申请日: | 2010-09-25 |
| 公开(公告)号: | CN102073668A | 公开(公告)日: | 2011-05-25 |
| 发明(设计)人: | B·D·约翰逊;M·J·艾斯皮格;S·B·梅达帕蒂 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 姬利永;袁逸 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数字 视频文件 搜索 提取 数字图像 | ||
背景
本发明一般涉及用于处理和播放视频文件的设备。
电子形式的视频信息可由数字多用盘(DVD)播放器、电视接收机、电缆盒、机顶盒、计算机以及MP3播放器来播放,这里列举了几个示例。这些设备作为具有不可分解图像元素的原子单元来接收视频文件。
附图简述
图1是根据一个实施例的装置的描绘;
图2是一个实施例的流程图;以及
图3是根据一个实施例的元数据架构的描绘。
详细描述
根据一些实施例,数字视频文件可被拆分成组成描绘数字图像。这些数字图像可与数字视频文件的其余部分分开并以各种方式来操纵。在一些实施例中,数字视频文件可预编码有元数据以促成该操作。在其他实施例中,在制作出视频文件之后,可对其进行分析和处理以开发出这种信息。例如,也可以使用与数字视频文件相关联的信息,包括相关联的文本(包括不是数字视频文件一部分的字幕)。在另一个实施例中,在针对特定类型的对象搜索数字视频文件的过程中,可实时地在数字视频文件内标识出这些对象。
参照图1,根据一个实施例,计算机10可以是个人计算机、移动因特网设备(MID)、服务器、机顶盒、电缆盒、视频回放设备(诸如DVD播放器)、摄像机、或电视接收机,这里列举了一些示例。计算机10有能力处理视频文件以供播放、供进一步操作、或供存储,这里列举了一些示例。
在一个实施例中,计算机10包括耦合到总线14的编码器/解码器(CODEC)12。总线14还耦合至视频接收机16。视频接收机可以是广播接收 机、电缆盒、机顶盒、或媒体播放器(诸如DVD播放器),这里列举了几个示例。
在一些情形中,可由元数据接收机17与接收机16分开地接收元数据。由此,在使用元数据的一些实施例中,可随数字视频文件一起接收元数据,而在其他实施例中,可在带外提供元数据供分开的接收机(诸如元数据接收机17)接收。
总线14在一种架构中可耦合至芯片组18。芯片组18耦合至处理器20和系统存储器22。在一个实施例中,提取应用24可被存储在系统存储器22中。在其他实施例中,提取应用可由CODEC 12执行。在其他实施例中,提取序列可在硬件中实现,例如由CODEC 12实现。图形处理器(gfx)26可耦合至处理器20。
因此,在一些实施例中,提取序列可从数字视频文件提取视频图像。数字视频文件中内容的本质涵盖电影、广告、剪辑、电视广播、以及网播,这里给出几个示例。该序列可在硬件、软件、或固件中执行。在基于软件的实施例中,可通过由处理器、控制器或计算机(诸如处理器20)执行的指令来完成该序列。这些指令可存储在合适的存储中,包括半导体存储器、磁存储器或光学存储器,作为一个示例诸如系统存储器22。因此,诸如存储之类的计算机可读介质可存储指令供处理器或其他指令执行实体执行。
参照图2,序列24始于视频图像搜索,如框28中指示的。因此,在一些实施例中,用户可输入一个或更多个搜索项以定位数字视频文件中可能描绘了的感兴趣对象。搜索引擎随后可实现对包含该信息的数字视频文件的搜索。在一个实施例中,该搜索可使用关键词搜索来完成。可被搜索的文本包括与数字视频文件相关联的元数据、字幕、以及与数字视频文件有关的文本。在一些情形中,搜索可被自动化。例如,用户可运行对感兴趣主题、人物或对象的运行中搜索,包括数字视频文件中包含的这些项。
在一些实施例中,数字视频文件可与元数据或附加信息相关联。该元数据可以是数字视频文件的一部分或者可以与其分开。元数据可提供关于视频文件以及其中描绘的对象的信息。元数据可用来在另外为原子性且不可分解的数字视频文件内定位感兴趣对象。附加信息包括不是文件一部分但能用来标识该文 件中的对象的任何数据。它可包括描述性文本,包括与数字视频文件相关联的字幕。
因此,作为示例,参照图3,元数据可按视频文件内描绘的各种对象来组织。元数据例如可具有关于棒球对象的信息,并且在棒球下面可以是关于该文件中描绘的体育场和运动员的信息。例如,在体育场下面,可以包括诸如扬基(Yankee)体育场和红袜(Red Sox)体育场之类的对象描述。这些对象描述中的每一者可与给出关于对象的位置、大小、类型、运动、音频和边界状况中的一项或更多项的信息的元数据相关联。
通过“位置”旨在表示其中描绘该对象的一个或多个帧,且在一些情形中,表示该对象在每一帧内的位置的更详细坐标。关于大小,作为一个示例,对象的大小可按像素数目的形式给出。作为示例,类型可以是对象是否为人物、物理对象、静止的对象、或移动的对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010500840.6/2.html,转载请声明来源钻瓜专利网。





