[发明专利]节目端点时间检测装置和方法以及节目信息检索系统有效
| 申请号: | 200910208950.2 | 申请日: | 2009-10-30 |
| 公开(公告)号: | CN102073635A | 公开(公告)日: | 2011-05-25 |
| 发明(设计)人: | 刘昆;吴伟国;卢鲤;赵庆卫;颜永红;索宏斌 | 申请(专利权)人: | 索尼株式会社;中国科学院声学研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 节目 端点 时间 检测 装置 方法 以及 信息 检索系统 | ||
技术领域
本发明涉及多媒体内容检索领域,特别涉及一种采用音频信号处理的方法对节目的端点时间进行检测的节目端点时间检测装置和方法以及节目信息检索系统。
背景技术
一般体育视频比赛时间比较长,而往往广大体育爱好者真正关心的内容通常只占居整场内容的很小一部分。随着越来越多的体育视频冲击,使得人们对体育视频的有效检索和管理的要求也越来越迫切。很多时候,人们没有足够时间观看实况转播,因此,很多爱好者会采取将体育节目录制出来,然后等自己有时间的时候再拿出来观看。在观看的时候,用户会有选择的观看其中的一些重要场次,比如下半场、决赛局等。因此,在这种情况下,能够准确获取比赛场次的起始时间信息是非常重要的。
另一方面,如果需要从中找到自己关注的内容,往往需要用户从头至尾遍历一遍之后才能找到所需内容,这样既费时又费力。因此,如果能够有这样一个体育内容检索系统,可以帮助用户检索一些真正关心的内容,就可以大大节约时间。
关于上述课题,本领域技术人员进行了如下的研究。
非专利文献1中,仅利用语音信息来对广告,篮球比赛,足球比赛,新闻报道和天气预报5类电视节目进行识别,采用的是神经网络分类器,最后结合图像分析以提高准确性,没有对电视节目的内容进行分析和检索。
非专利文献2中,结合视频特征用决策树来检测足球比赛进球场景,但是仅对一种体育比赛中的进球进行检索,该检测框架仅适用于足球比赛,对于其他的比赛就不适用了。
专利文献1中,同时利用音频和视频特征对体育比赛进行场景分类,包括:场地全景、特写镜头、角球、任意球和进球五类场景,其中音频特征主要是用来识别鼓掌声和哨声两种类别。
专利文献2中,仅仅利用语音识别技术得到文本内容,在识别后得到的文本内容里面进行待搜索内容匹配,得到需要检索的内容。
专利文献3中,第一阶段对有人工标注的多媒体数据利用语义标签进行相关音频寻找,第二阶段,基于语义标签的音频查询结果在线训练该类音乐特征,并利用于音频内容的查询。
专利文献4中,提出了一种音频、视频内容的采集方法和检索方法,其中音频方面采用将声音分段后识别,生成声音与文字的对应关系表,用户使用所需声音片断对用的文字在该对应关系表中进行检索。
从以上研究可以看出,目前已有的研究仅对某一两种体育比赛内容的特定内容进行分析和检测,这些研究针对性强,不能很好的扩展到其他类别的体育比赛的内容检索中去。而随着体育比赛种类的日益增加,消费者越来越不可能有足够的时间将整场比赛从头至尾的观看一遍了,因此,如何能够提供一套自动的体育比赛的内容检索系统,从而帮助用户快速方便的检索出自己关注的内容是目前广大体育爱好者们迫切关注的问题。
非专利文献1:Liu,Z.,et al.,“Audio feature extraction and analysis for scenesegmentation and classification”,Journal of VLSI Signal Processing,pp.61 to 70(1998).
非专利文献2:Shu-Ching Chen,Mei-ling Shyu,Min Chen,Chengcui Zhang,“A decision tree-based multimodal data mining framework for soccer goaldetection”,2004 IEEE International Conference on Multimedia and Expo,Volume1,June 2004,pp.265-268.
专利文献1:US 2005/0195331 A1
专利文献2:CN101281534
专利文献3:CN101364222
专利文献4:CN101102240
发明内容
为了实现上述目的,本发明提供一种节目端点时间检测装置,通过对所述节目的音频信号进行处理,从而检测所述节目的端点时间,该装置包括:音频分类单元,将所述音频信号分类为语音信号部分和非语音信号部分;关键词检索单元,从所述语音信号部分检索表示节目开始或结束的端点关键词,作为候选的端点关键词;内容分析单元,对通过所述关键词检索单元检索出的所述候选的端点关键词的上下文进行内容分析,以确定所述候选的端点关键词是否为有效的端点关键词;以及节目端点时间确定单元,基于所述关键词检索单元的检索结果和所述内容分析单元的确定结果进行统计分析,确定节目的端点时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社;中国科学院声学研究所,未经索尼株式会社;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910208950.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半挂车电气管路走线结构
- 下一篇:节水型防泄漏水阀





