[发明专利]基于音频频谱特征分析的演唱音色明亮度客观评测方法无效
| 申请号: | 200810224790.6 | 申请日: | 2008-12-26 |
| 公开(公告)号: | CN101650941A | 公开(公告)日: | 2010-02-17 |
| 发明(设计)人: | 颜永红;潘接林;刘建;李明;曹川 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
| 主分类号: | G10L11/00 | 分类号: | G10L11/00 |
| 代理公司: | 北京法思腾知识产权代理有限公司 | 代理人: | 杨小蓉 |
| 地址: | 100190北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 音频 频谱 特征 分析 演唱 音色 明亮 客观 评测 方法 | ||
1、一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法,包括如下步骤:
1)选取需要度量音色明亮度的演唱片段音频信号;
2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断;
3)对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度:2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和;
4)根据上述步骤3)中得到的频谱特征,计算得到最终的音色明亮度的客观度量参数指标:平均2K-3KHz能量比、平均谱重心,然后利用求出的参数指标对演唱音色的明亮度进行评测。
2、如权利要求1所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方法,其特征在于,所述步骤4)中,在利用求出的参数指标对演唱音色的明亮度进行评测时,单独基于所述平均2K-3KHz能量比或者平均谱重心进行评价,或者将所述平均2K-3KHz能量比和平均谱重心相结合进行评价。
3、如权利要求1或2所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方法,其特征在于,所述步骤2)中的判断方法包括:基于能量的语音活动检测算法以及基于基频检测算法的voice/nonvoice判断机制。
4、如权利要求1或2所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方法,其特征在于,
所述步骤3)中各频谱特征测度的计算方法分别为:
1)2K-3KHz能量和:计算公式为
其中,Si(f)为该帧的快速傅立叶变换能量谱;
2)频谱能量总和:计算公式为
ET=∫Si(f)df;
3)频率加权的谱能量和:
用频率值对频谱能量值进行加权,其计算方法为,
EW=∫f·Si(f)df;
所述步骤4)中根据上述频谱特征计算得到的最终的音色明亮度的客观度量参数指标为:
1)平均2K-3KHz能量比R:
对于任何演唱帧,其2K-3KHz能量比的计算公式为,
所述平均2K-3KHz能量比R是该演唱音频信号中所有演唱帧2K-3KHz能量比Ri的算术平均值,该平均2K-3KHz能量比R作为演唱音色明亮度的一个客观度量时,取值范围为0~1,平均2K-3KHz能量比R越大,则演唱片段音色明亮度越高;
2)平均谱重心C:
对于任何演唱帧,其谱重心的计算公式为,
平均谱重心C是该演唱音频信号中所有演唱帧谱重心Ci的算术平均值,该平均谱重心C作为演唱音色明亮度的另一个客观度量时,取值范围为0~8000,平均谱重心C越大,则演唱片段音色明亮度越高;
3)当将上述平均2K-3KHz能量比R和平均谱重心C两个度量指标结合起来对音色明亮度进行评测时,将这两种测度进行加权平均后的值作为指标,所述加权的方式采用线性加权或者指数加权。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810224790.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:滑动缸外开配气发动机
- 下一篇:可开关安全内旋塞球阀





