[发明专利]音乐片段检测设备和方法以及音乐信号检测设备无效
| 申请号: | 201210107008.9 | 申请日: | 2012-04-12 |
| 公开(公告)号: | CN102750947A | 公开(公告)日: | 2012-10-24 |
| 发明(设计)人: | 东山惠祐;安部素嗣 | 申请(专利权)人: | 索尼公司 |
| 主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L19/00;G10L21/02 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;唐京桥 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音乐 片段 检测 设备 方法 以及 信号 | ||
技术领域
本技术涉及音乐片段检测设备和方法、程序、记录介质以及音乐信号检测设备,并且更加具体地涉及能够从输入信号中检测音乐部分的音乐片段检测设备和方法、程序、记录介质以及音乐信号检测设备。
背景技术
过去,多首歌曲(音乐)已用在电视广播或无线电广播的广播节目中。在广播节目当中,存在如音乐节目中那样音乐明显地用作主要部分的节目,以及如戏剧中那样音乐用作背景音乐(BGM)的节目。
对于广播节目的观众而言,常常存在例如仅再生和观看音乐节目的音乐部分的需要。
进一步,对于广播电台而言,常常存在如下需要:容易地支付版权费,或者涉及根据广播节目通过管理使用的音乐来对广播节目进行编辑。
当准备了音乐数据库时,这可以通过使用如下技术来实现:将广播节目的语音信号和数据库的语音信号相比较,并且搜索广播节目的语音信号中包括的音乐。然而,当没有准备音乐数据库时,或者当广播节目的语音信号中包括的音乐没有登记到数据库时,难以使用上面描述的音乐搜索技术。在这种情况下,用户不得不收听广播节目并检查音乐的存在与否或者一致性。收听这样的大量广播节目会花费许多时间和努力。
在这点上,已提议了从广播节目的语音信号中检测包括音乐的片段的技术。
例如,存在如下技术:当输入信号被变换成频谱时,基于峰值在时间方向上持续的时间段来检测音乐片段(例如参见日本专利申请公开(JP-A)第10-301594号)。
发明内容
根据JP-A第10-301594号中公开的技术,可以以高精确度从仅在特定时间包括音乐的输入信号(诸如音乐节目的语音信号或者其中与音乐相比具有足够较低水平的非音乐声音(在下文中称之为“噪声”)与音乐相混合的输入信号)中检测音乐片段。
然而,从其中音乐作为BGM与噪声(如具有与如戏剧中那样的音乐几乎相同水平的语音)相混合的输入信号中,难以适当地检测频谱的峰值,所以检测音乐片段的准确性很可能降低。
进一步,存在如下技术:使用诸如对话或解说之类的语音通常被定向到广播节目中的中心这一特征,通过从输入信号的左声道信号中减去右声道信号(或者从右声道信号中减去左声道信号)来排除语音(噪声)的影响。然而,难以将这种技术应用于电视广播,并且同样难以将这种技术应用于其中音乐被定向到中心的输入信号。另外,独立于左右声道而生成通过语音压缩而得到的量化噪声,这样一来在这种技术中,与原始输入信号具有低相关性的量化噪声就可能包括在相减信号中。
进而,在频谱中被形成以在时间方向上持续的峰值不限于通过音乐造成,而是峰值可以通过噪声、旁瓣、干扰或时变音调等而造成。因为这个原因,难以从基于峰值的音乐片段的检测结果中完全排除除了音乐之外的噪声的影响。
如上所述,已难以以高精确度从其中音乐与具有几乎与音乐相同的水平的噪声相混合的输入信号中检测音乐部分。
考虑到前述状况而做出本技术,并且希望以高精确度从输入信号中检测音乐部分。
根据本技术的实施例,提供了一种音乐片段检测设备,该音乐片段检测设备包括:指标计算单元,其基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标;以及音乐确定单元,其基于所述音调指标确定所述输入信号的每个区域是否包括音乐。
指标计算单元可以设置有:最大点检测单元,其从预定时间段的输入信号中检测信号分量的最大强度点;以及逼近处理单元,其通过二次函数在最大点附近逼近信号分量的强度。基于信号分量在最大点附近的强度和二次函数之间的误差,指标计算单元可以计算该指标。
指标计算单元可以根据二次函数的曲率来调整指标。
指标计算单元可以根据二次函数的最大点的频率来调整指标。
音乐片段检测设备可以进一步包括:特征量计算单元,其基于对应于预定时间的输入信号的每个区域的音调指标,计算对应于所述预定时间的输入信号的特征量;并且当特征量大于预定阈值时,音乐确定单元可以确定对应于预定时间的输入信号包括音乐。
通过针对每个频率在时间方向上求取对应于预定时间的输入信号的每个区域的音调指标的积分,特征量计算单元可以计算该特征量。
通过在对应于预定时间的输入信号的每个区域中针对每个频率求取其中大于预定阈值的音调指标在时间方向上最连续的区域的音调指标的积分,特征量计算单元可以计算该特征量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210107008.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型制冷系统换热设备
- 下一篇:一种新型太阳能电池光伏焊带装置





