[发明专利]一种敲击弦乐器的音乐多音符估计方法及系统有效
申请号: | 201410325609.6 | 申请日: | 2014-07-09 |
公开(公告)号: | CN105304073B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 周若华;万玉龙;颜永红;王宪亮 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10H3/12 | 分类号: | G10H3/12;G10H1/00;G10L25/27 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;吕爱霞 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敲击 弦乐器 音乐 多音 估计 方法 系统 | ||
本发明涉及一种基于非负矩阵分解的敲击弦乐器的音乐多音符估计方法,该方法利用敲击弦乐器的单音音频数据构建音符能量谱包络基矩阵,通过对多音能量谱包络的非负矩阵分解,求得各音符在多音片段中的能量权重系数,最后对音符权重大小进行阈值限定求得多音片段中的多音符分布。与传统方法比较,基于非负矩阵分解的音乐多音符估计方法只利用了音符起始点处的能量谱包络信息,同时结合了能量谱包络的线性叠加性来分解能量谱,符合局部构建整体的音符叠加机理,多音符估计性能得到明显提升,同时系统速度也有一定提升,具有很高的实用性。
技术领域
本发明涉及钢琴音乐的多音符估计方法,更具体地说,本发明涉及基于非负矩阵分解的钢琴音乐多音符估计方法。
背景技术
随着计算机技术的快速发展,自动音乐记谱技术成为音乐信号处理领域的研究热点之一。其中,钢琴音乐等敲击弦的乐器的自动记谱技术研究是最为关键的一个分支。作为典型的多音乐器,钢琴音乐等敲击弦的乐器的自动记谱技术的难点和重点都在于同一时刻的多音符估计。
针对如何解决同一时刻的多音符估计问题,现有的技术手段包含:模式识别的方法,特征分析的方法和矩阵分解的方法。但是这些技术手段各自的缺陷为:其中,模式识别的方法由于未能考虑到多音符频谱重叠的问题,容易导致音符的漏检;特征分析的方法通常采用固定的筛选规则,不能自适应的对待测文件进行处理;矩阵分解的方法通常未利用单音符的能量信息,同时当待测多音片段较大时,系统的处理压力也较大。
发明内容
本发明的目的在于,为了克服上述问题,本发明提供一种敲击弦乐器的音乐多音符估计方法及系统,该方法利用钢琴单音片段构建能量谱包络基矩阵,通过非负矩阵分解来提高钢琴多音符估计的性能。
为了实现上述目的,本发明提供一种敲击弦乐器的音乐多音符估计方法,所述方法包含:
步骤101)利用单音片段构建单音符的能量谱包络基矩阵;
步骤102)根据得到的单音片段的能量谱包络基矩阵,将基于待识别的多音片段得到的归一化的平均能量谱包络通过非负矩阵分解算法进行音符结果估计,即判断待识别的多音片段中存在的单音符情况。
可选的,上述步骤101)进一步包含:
步骤101-1)通过RTFI时频分析方法,采用如下公式求得单音片段的平均能量谱包络:
其中,i表示帧索引,m表示频率分析点索引,AESk(i,m)表示第k个单音片段的平均能量谱在第i帧第m个频率分析点处的大小,Ncfm表示用于计算能量谱包络的总帧数,AEEk(m)表示第k个单音片段的平均能量谱包络在第m个频率分析点处的大小;
步骤101-2)对单音片段的平均能量谱包络进行能量归一化和排序处理进而得到构建的单音能量谱包络基矩阵,所述归一化处理公式为如下的公式(2),所述排序公式为如下的公式(3):
AEEB={AEE1,AEE2,...,AEEn} (3)
其中,n是音符个数,min(AEEk)代表第k个音符片段的平均能量谱包络中的最小值,max(AEEk)表示第k个音符片段的平均能量谱包络中的最大值,AEEB为单音谱包络基矩阵,音高从低到高顺序为:AEE1<AEE2,...,<AEEn。
可选的,上述步骤102)进一步包含:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410325609.6/2.html,转载请声明来源钻瓜专利网。