[发明专利]基于音频频谱特征分析的演唱音色明亮度客观评测方法无效
| 申请号: | 200810224790.6 | 申请日: | 2008-12-26 |
| 公开(公告)号: | CN101650941A | 公开(公告)日: | 2010-02-17 |
| 发明(设计)人: | 颜永红;潘接林;刘建;李明;曹川 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
| 主分类号: | G10L11/00 | 分类号: | G10L11/00 |
| 代理公司: | 北京法思腾知识产权代理有限公司 | 代理人: | 杨小蓉 |
| 地址: | 100190北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 音频 频谱 特征 分析 演唱 音色 明亮 客观 评测 方法 | ||
技术领域
本发明涉及一种度量演唱音色明亮度的客观方法,更具体地说,本发明涉及一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法。
背景技术
音色明亮度是指一种用于评价唱歌者演唱水平的主观指标,一般定义为对唱歌者歌声的一种明亮、高昂、温暖的主观感知。主观评价人感觉唱歌者的歌声越明亮、高昂,则认为唱歌者的演唱音色明亮度越高,反之,则认为演唱音色明亮度越低。这里的主观评价人,一般指的是声乐专家,比如声乐老师和资深音乐家。而唱歌者可以是专业的歌手、声乐系学生,也可以是普通人。
目前,演唱评价基本还是处于完全依靠专家主观评价的阶段,并没有成熟的客观评价系统能够对演唱水平或演唱水平的某个方面进行度量和评价。演唱音色明亮程度的评价也完全依赖专家的主观感知,目前还没有客观度量的方法或者辅助主观评价的客观指标。虽然国外一些研究调查发现音色明亮度的评价和频谱能量分布、共振峰位置、能量等有关,但是并没有具体的、定义明确的客观度量方法出现。例如,文献1提出音色明亮度与频谱能量分布有关,但是并没有给出具体的计算方法。另外,演唱水平的评价与旋律音高的准确性相关,演唱者音高的提取,我们采用了参考文献2中提出的方法,该方法通过求取每帧数据频谱谐波和最大值对应的基频作为每帧的音高值。这里,需要说明的是,该方法得到的音高值仅仅作为计算音色的一个基本参数值,与本专利的独特性无关。
另外,主观演唱评价方法不可避免的具有以下几个缺点:第一,不可重复性。因为各种各样因素的影响,对于同样一个演唱片段,两次主观评价之间或多或少的都会出现差异,而这种差异在理想情况下是不应该存在的。第二,主观偏向性。因为每个评价人都有各自不同的喜好,所以对于同一个演唱片段,每个评价人都有各自不同的评价,都有各自的偏向性。第三,费用昂贵,可获得性差。对于一般的普通人来说(不是专业的声乐学校的学生),要获得声乐专家的主观评价,是很困难的或费用高昂的。
参考文献1:E.Ekholm,G.Papagiannis,and F.Chagnon,“Relating ObjectiveMeasurements to Expert Evaluation of Voice Quality in Western Classical Singing:Critical Perceptual Parameters,”Journal of Voice,vol.12,no.2,pp.182-196,1998.
参考文献2:C.Cao,M.Li,J.Liu,and Y.Yan,“Singing Melody Extraction inPolyphonic Music by Harmonic Tracking,”Proc.8th International Conference on MusicInformation Retrieval(ISMIR),pp.373-374,2007.
发明内容
因此,鉴于上述现状,本发明的目的在于提供一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法,通过对演唱片段的频谱特征分析,给出可以量化的客观评测参数指标。
为实现上述发明目的,本发明提供的基于音频频谱特征分析的演唱音色明亮度的客观评测方法,包括如下步骤:
1)选取需要度量音色明亮度的演唱片段音频信号;
2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断;
3)对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度:2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和;
4)根据上述步骤3)中得到的频谱特征,计算得到最终的音色明亮度的客观度量参数指标:平均2K-3KHz能量比、平均谱重心,然后利用求出的参数指标对演唱音色的明亮度进行评测。
其中,上述步骤4)中,在利用求出的参数指标对演唱音色的明亮度进行评测时,可以单独基于所述平均2K-3KHz能量比或者平均谱重心进行评价,也可以将所述平均2K-3KHz能量比和平均谱重心相结合来进行评价。
另外,所述步骤2)中的判断方法包括:基于能量的语音活动检测算法以及基于基频检测算法的voice/nonvoice判断机制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810224790.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:滑动缸外开配气发动机
- 下一篇:可开关安全内旋塞球阀





