[发明专利]一种歌声侦测的方法有效

专利信息
申请号: 201810170413.2 申请日: 2018-03-01
公开(公告)号: CN108538309B 公开(公告)日: 2021-09-21
发明(设计)人: 龚俊;熊永春 申请(专利权)人: 杭州小影创新科技股份有限公司
主分类号: G10L25/18 分类号: G10L25/18;G10L17/00;G10L25/51;G10L25/81
代理公司: 杭州天昊专利代理事务所(特殊普通合伙) 33283 代理人: 董世博
地址: 310000 浙江省杭州市西湖*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 歌声 侦测 方法
【说明书】:

发明公开了一种歌声侦测的方法,具体包括如下步骤:101)获取BGM频谱特征步骤,102)剔除BGM步骤,103)人声判断步骤,104)侦测数据的后处理步骤;本发明提供一种通过歌曲分析,侦测出歌声段落,免去了手动定位的繁琐操作的一种歌声侦测的方法。

技术领域

本发明涉及音频处理领域,更具体的说,其涉及用于一种歌声侦测的方法。

背景技术

随着智能手机的普及,音视频编辑在手机上的应用越来越广,而利用手机制作一段自己专属的MV逐渐成为一种风尚。在手机上制作个人MV所选用的歌曲往往随意性较大,在配置歌词时,一般通用的歌词文件所给出的时间点往往无法与歌曲相匹配,因此需要用户自己配置字幕,实际使用时需要用户自己定位以到“声词同步”的效果。

现有的做法:每一段歌唱开始点,都需要用户先听一下,大致确认在什么位置,然后拖动播放进度条到大致范围;再播放听一下,然后较为细致的来回拖动;如此可能要反复几轮。期间,万一出现误操作,则需要重新来一遍。在手机上用这种手工方式做定位,需要消耗大量的时间和精力,限制了个人的创作与发挥。

发明内容

本发明的目的在于提供一种通过歌曲分析,侦测出歌声段落,免去了手动定位的繁琐操作的一种歌声侦测的方法。

为了解决上述技术问题,本发明的技术方案如下:

一种歌声侦测的方法,具体步骤如下:

101)获取BGM频谱特征步骤:选定出目标歌曲中一段没有歌唱的纯背景音乐即BGM,提取其频谱特征,所述频谱特征的获取方式为先将BGM划分为N个单元,提取每个单元的频谱,而后求其频谱均值来作为其频谱特征;

102)剔除BGM步骤:根据步骤101)针对一个频点,遍历其前后5个单元的相应频点的频谱特征,并根据频谱特征得到的频谱值来找出其中的次极大值;当次极大值大于等于该值时,则该频点为需要进行剔除处理的频点;

103)人声判断步骤:将经过步骤102)处理后的音频信号,利用WebRTC来判断人声,并将音频信号分割为每次输入10ms的音频信号,WebRTC检测后的结果为“真”表示是人声,为“假”表示不是人声;所述WebRTC是Google开放项目,其中的VAD功能用于检测人声;

104)侦测数据的后处理步骤:将步骤103)的判断后的结构数据进行处理,最终将以时间段落的方式呈现歌声,具体包括如下处理的状况:

将步骤103)中经过判断的每段检测结果作为一个结果单元,根据其是否在歌声区域进行进一步的判别处理,当该结果单元处于歌声区域,并且WebRTC检测结果为“真”,则计算已有歌声区间的长度,当其大于歌声区间的长度则判定构建为一段歌唱区间,并进行重置标志量,若其小于歌声区间的长度则进行下一个结果单元的判定;当该结果单元处于歌声区域,并且WebRTC检测结果为“假”,则进行累加静音时长,再将该静音时长与预设的一首歌的静音阈值进行比较,若小于静音阈值则直接进行下一个结构单元的判定,若大于等于静音阈值则计算前一段声长并与声长下限阈值进行对比,若小于声长下限阈值则丢弃这段数据,重置标志量,若大于下限阈值则构建为一段歌唱区间,重置标志量;当该结果单元不处于歌声区域,则进一步判定是否是歌声,若是,则标志歌声开始,若不是,则进行下一个结果单元的判定。

进一步的,所述步骤102)某个需要进行剔除处理的频点的频谱值为X(k),则处理后的频谱值为

X′(k)=G*X(k) 公式(1)

其中G=0.000001为剔除增益;因直接这样抹除BGM,其处理后的信号平滑性仍不足。声音会有触发、衰减、延续、释放的过程,因此还需进一步结合该机理过程,在触发和释放阶段做平滑处理。

进一步的,所述平滑处理,具体处理方式如下:

触发阶段取20毫秒,释放阶段取100毫秒;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州小影创新科技股份有限公司,未经杭州小影创新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810170413.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top