[发明专利]能识别音乐自动成谱的方法有效
申请号: | 201510389632.6 | 申请日: | 2015-07-06 |
公开(公告)号: | CN104992712B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 刘德文;茄振中;陈洪波;阮广璇 | 申请(专利权)人: | 成都云创新科技有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/21;G10L25/27;G10L25/90;G10G3/04;G06K9/54 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 赵正寅 |
地址: | 610000 四川省成都市成华区建*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 音乐 自动 方法 | ||
1.能识别音乐自动成谱的方法,其特征在于,包括如下步骤:
(1)识别音频,追踪整体频谱的变化,实时检查是否有发音趋势;
(2)追踪每个音高的频谱变化,实时检查哪些是音高发声;
(3)继续追踪已发声音高的频谱变化,检查之前的音高发声判断是否是误判;
(4)根据以上步骤获得的发声音高数据、发声时间数据,估算曲谱的速度、调式以及音符类型,生成曲谱。
2.根据权利要求1所述的能识别音乐自动成谱的方法,其特征在于,所述步骤(1)前,还需作环境噪音频谱分析,具体方法为:
(L1)能量值单位取分贝,对环境噪音进行一段时间的采样,记录环境噪音在此段时间内的平均频谱能量值分布A以及每个频率段能量在时间分布的标准差值V;
(L2)根据平均频谱能量值分布A和标准差值V拟定每个频率段的发声能量阈值 TTL,TTL=AxP+VxQ,P、Q为固定值。
3.根据权利要求2所述的能识别音乐自动成谱的方法,其特征在于,所述步骤(1)中,发音趋势的检查方法为:
(11)设定有效的发音频率范围为20HZ~20000HZ;
(12)计算在该范围内当前频谱超过发声能量阈值 的面积Area;
(13)如果该面积Area大于预设的面积阈值 Attl,则认为音频此时具有发音趋势,否则,认为当前音频依然是静音。
4.根据权利要求3所述的能识别音乐自动成谱的方法,其特征在于,所述步骤(2)中,音高发声的检查方法为:
(21)针对每个潜在发声的音高,分析该音高的基频和谐频是否存在区间能量的峰值,且该峰值必须大于发声能量阈值 才被纳入计算;
(22)根据峰值是否存在以及峰值的大小,计算每个音高可能发声的置信度L;
(23)检查置信度最大的音高是否满足条件,若满足条件,则认为该音高在此时发声,同时消除该音高的基频和谐频的峰值对其他音高的影响;
(24)计算其他音高的置信度L,对余下置信度最大的音高循环以上条件的判断,继续寻找发声的音高,直至没法满足条件时终止。
5.根据权利要求4所述的能识别音乐自动成谱的方法,其特征在于,所述步骤(23)中,置信度最大的音高需同时满足的条件为:
a、此时该音高的置信度值L突然从平稳或下降状态变成剧增状态,当前的置信度值L要大于前一帧的置信度值的一定倍数;前一帧的置信度值要在之前一段时间内的置信度均值的一定比例范围内,即前一帧的置信度呈平稳或下降状态;
b、置信度最大值占所有音高置信度值总和的比例是否大于阈值 。
6.根据权利要求5所述的能识别音乐自动成谱的方法,其特征在于,所述步骤(3)中,检查是否误判的方法为:
(31)设定时间长度t为检查误判的时间范围;
(32)如果发现发声音高在这段时间t内置信度值衰减过快,则认为该音高发声为误判。
7.根据权利要求6所述的能识别音乐自动成谱的方法,其特征在于,所述步骤(4)中,估算曲谱的速度的方法为:
(411)预设速度范围为每分钟30~240个四分拍;
(412)针对每个速度值,根据每次音高发声的时间间隔,估算该音符的时长类型,限定时长类型为全音符、二分音符、四分音符、八分音符、十六分音符,通过合理拟定每类时长类型的时间长度范围,如果有时长超过全音符的则用全音休止符填充多余空白的时长,据此可以把所有音符都归纳到以上时长类型中;
(413)计算每个音符实际时长和该速度下标准时长的偏差值;
(414)比较所有速度下偏差值总和,取最小偏差值下的速度为估算速度;
估算曲谱调式的方法为:
(421)针对12个大小调,判断在该调式下出现的增减音个数n、五音个数m、该调式升降号数d,正数表示升号数,负数表示降号数;
(422)筛选出增减音个数最小的调式,如果存在两个或以上调式同时符合,则继续筛选;
(423)进一步筛选出五音个数最多的调式,如果依然存在两个或以上调式同时符合,则继续筛选;
(424)进一步筛选出升降号数最少的,如果最终依然存在升降号数一样的两个调式,则筛选出升调的调式;
估算曲谱音符类型的方法为:
(431)限定时长类型有全音符、二分音符加点、二分音符、四分音符加点、四分音符、八分音符加点、八分音符、十六分音符,定义每个时长类型对应真实时长范围,把所有音符归纳到以上时长类型中;
(432)根据音符顺序,把合适数量的音符归纳到一小节中,如果出现音符时长超过全音符,则让该音符时长变为到达小节结束前时长类型,余下时长用休止符填充;如果出现音符跨越小节,且结束点在小节开头的八分拍以内,则把该音符时长改变为在前一个小节结束;如果出现音符结束点在小节结尾的最后一个八分拍以内的,而且下一个音符时长超过或等于四分音符,则让下一个音符直接出现在下一个小节的开头。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都云创新科技有限公司,未经成都云创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510389632.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高可靠SRAM编译器控制电路
- 下一篇:一种英语口语自动打分方法及系统