[发明专利]一种歌声位置检测方法及装置有效
申请号: | 201410109432.6 | 申请日: | 2014-03-21 |
公开(公告)号: | CN104091600A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 孔令城 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/48 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 歌声 位置 检测 方法 装置 | ||
1.一种歌声位置检测方法,其特征在于,包括:
获取待检测歌曲或经过至少一次处理后的待检测歌曲中当前帧歌曲的特征,所述待检测歌曲划分为多帧歌曲;
如果所述当前帧歌曲的特征满足预置的第一策略,储存所述当前帧歌曲的标识信息;
将所述待检测歌曲的所有帧歌曲中,特征满足预置的第二策略的第一个帧歌曲的标识信息,与储存的所述标识信息进行比较,选择某一标识信息对应帧歌曲所在位置作为所述待检测歌曲中包含歌声的位置;
其中,所述选择的标识信息对应帧歌曲排在所述待检测歌曲较后的位置。
2.如权利要求1所述的方法,其特征在于,所述获取的待检测歌曲中当前帧歌曲的特征包括:能量特征、过零率和谱通量;
所述预置的第一策略包括:一帧歌曲的能量大于预置的第一阈值,过零率大于预置的第二阈值,且谱通量大于预置的第三阈值;
所述预置的第二策略包括:一帧歌曲的某一特征大于预置的值。
3.如权利要求1所述的方法,其特征在于,所述获取待检测歌曲或经过至少一次处理后的待检测歌曲中当前帧歌曲的特征之后,还包括:
如果所述当前帧歌曲为所述待检测歌曲中前段部分歌曲,则对获取的所述当前帧歌曲的特征进行抑制。
4.如权利要求2或3所述的方法,其特征在于,如果所述特征为能量特征,则所述获取待检测歌曲中当前帧歌曲的特征,具体包括:
计算所述当前帧歌曲的信号的平方和;
用所述平方和与所述待检测歌曲中所有帧歌曲的信号的平方和的最大值的商作为所述当前帧歌曲的能量特征。
5.如权利要求2或3所述的方法,其特征在于,如果所述特征为过零率,则所述获取待检测歌曲中当前帧歌曲的特征,具体包括:
计算所述当前帧歌曲的信号中样本改变符号的次数;
用所述次数与所述待检测歌曲中所有帧歌曲的信号对应样本改变符号次数的最大值的商作为所述当前帧歌曲的过零率。
6.如权利要求4或5所述的方法,其特征在于,所述获取待检测歌曲中当前帧歌曲的特征之前,还包括:
对所述待检测歌曲进行带通滤波;
所述获取经过至少一次处理后的待检测歌曲中当前帧歌曲的特征,具体包括:获取经过所述带通滤波后的待检测歌曲中当前帧歌曲的特征。
7.如权利要求2或3所述的方法,其特征在于,如果所述特征为谱通量,则所述获取待检测歌曲中当前帧歌曲的特征,具体包括:
计算所述当前帧歌曲的信号与前一帧歌曲的信号归一化频谱系数的差的平方和,并将所述平方和作为所述当前帧歌曲的谱通量。
8.一种歌声位置检测装置,其特征在于,包括:
特征获取单元,用于获取待检测歌曲或经过至少一次处理后的待检测歌曲中当前帧歌曲的特征,所述待检测歌曲划分为多帧歌曲;
储存单元,用于如果所述特征获取单元获取的当前帧歌曲的特征满足预置的第一策略,储存所述当前帧歌曲的标识信息;
比较选择单元,用于将所述待检测歌曲的所有帧歌曲中,特征满足预置的第二策略的第一个帧歌曲的标识信息,与储存单元储存的所述标识信息进行比较,选择某一标识信息对应帧歌曲所在位置作为所述待检测歌曲中包含歌声的位置;
其中,所述选择的标识信息对应帧歌曲排在所述待检测歌曲较后的位置。
9.如权利要求8所述的装置,其特征在于,还包括:
抑制单元,用于如果所述当前帧歌曲为所述待检测歌曲中前段部分歌曲,则对获取的所述当前帧歌曲的特征进行抑制。
10.如权利要求8或9所述的装置,其特征在于,所述特征获取单元,具体包括:
能量特征计算单元,用于计算所述当前帧歌曲的信号的平方和;用所述平方和与所述待检测歌曲中所有帧歌曲的信号的平方和的最大值的商作为所述当前帧歌曲的能量特征;
过零计算单元,用于计算所述当前帧歌曲的信号中样本改变符号的次数;用所述次数与所述待检测歌曲中所有帧歌曲的信号对应样本改变符号次数的最大值的商作为所述当前帧歌曲的过零率。
11.如权利要求10所述的装置,其特征在于,还包括:
滤波单元,用于对所述待检测歌曲进行带通滤波;
则所述特征获取单元,具体用于获取经过所述带通滤波后的待检测歌曲中当前帧歌曲的特征。
12.如权利要求8或9所述的装置,其特征在于,所述特征获取单元,具体包括:
谱通量计算单元,用于计算所述当前帧歌曲的信号与前一帧歌曲的信号归一化频谱系数的差的平方和,并将所述平方和作为所述当前帧歌曲的谱通量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410109432.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于IOS设备的视频编辑方法及装置
- 下一篇:单簧管吹口