[发明专利]一种单音旋律曲线的匹配方法无效
| 申请号: | 200710178220.3 | 申请日: | 2007-11-28 |
| 公开(公告)号: | CN101447186A | 公开(公告)日: | 2009-06-03 |
| 发明(设计)人: | 颜永红;吴晓;李明;刘建;潘接林 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
| 主分类号: | G10L15/12 | 分类号: | G10L15/12;G10L15/08;G06F17/30 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 | 代理人: | 王 勇 |
| 地址: | 100080北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 单音 旋律 曲线 匹配 方法 | ||
技术领域
本发明属于语音信号处理技术领域,具体地说,本发明涉及一种旋律匹配方法。
背景技术
单音旋律曲线的匹配通常在音符级(note-based)或帧级(frame-based)上进行。理想情况下的旋律匹配路径是线性的(如图1)。但在实际中,待匹配旋律的最优匹配路径往往是非线性的。现有的非线性旋律匹配方法包括,动态时间弯折DTW(J.S.R.Jang and M.Y.Gao.A Query-by-SingingSystem based on Dynamic Programming.In-ternational Workshop onIntelligent systems Resolutions,12:2,2000),音符动态规划(S.Pauws.Cubyhum:A fully operational query by humming system.ISMIR 2002Conference Proceedings,pages 187-196,2002)。这些方法使用的都是从局部到整体的自下而上的匹配策略。在这种策略下,旋律首先在局部片段的小范围内进行比配,然后由这些局部片段的匹配解决方案构成较大片段的解决方案,进而得到整个旋律的匹配方案。但是,这种方案是从局部出发,无法充分利用全局的旋律线特征,导致容易出现匹配错误,将整体不相似的旋律牵强匹配在一起。
发明内容
本发明的目的是,克服现有技术的不足,提出一种从整体到局部进行匹配的单音旋律曲线匹配方法。
为实现上述发明目的,本发明提供的单音旋律曲线的匹配方法,包括如下步骤(参照图3):
1)将待匹配的两段单音旋律分帧,分别提取每一帧的基频,得到两个基频序列,记为A1,…,n和B1,…,m,其中1,…,n和1,…,m分别表示两段单音旋律的帧号;
2)选择划分点k,将所述基频序列A1,…,n划分为前、后两个子序列,选择划分点l,将所述基频序列B1,…,m也划分为前、后两个子序列,然后分别计算两个前子序列的线性匹配代价和两个后子序列的线性匹配代价,再将所得的两个线性匹配代价相加得到以k、l为划分点组合的基频序列A1,…,n、B1,…,m的折线匹配代价;选择不同的划分点组合,找出使得该折线匹配代价最小的最优划分点组合k、l(参考图2);
3)判断以所述最优划分点组合k、l进行划分得到的两个前子序列和两个后子序列的长度是否小于预先设定的门限值,如果判断为是,则匹配过程结束;如果判断为否,则将基频序列A1,…,n和B1,…,m的匹配问题分解为对两个前子序列进行匹配和对两个后子序列进行匹配的两个子问题(如图2右图),回到步骤2),找出前子序列和后子序列各自的最优划分点组合,这样不断循环,直到划分得出的子序列长度小于预先设定的门限值。
上述技术方案中,所述步骤2)中,以划分点k对所述基频序列A1,…,n进行划分是将基频序列A1,…,n划分为前子序列A1,…,k和后子序列Ak,…,n;以划分点l对所述基频序列B1,…,m进行划分是将基频序列B1,…,m划分为前子序列B1,…,l和后子序列Bl,…,m。
上述技术方案中,所述步骤2)中,所述划分点k在0.45n至0.55n的范围内选择,所述划分点l在0.45m至0.55m的范围内选择。
上述技术方案中,所述步骤2)中,所述划分点k和划分点l的选择可以穷尽各自所述范围内的所有点,也可以在各自所述范围内以一定间隔进行采样。
上述技术方案中,所述步骤2)中,所述线性匹配代价的计算方法为:先将两旋律线性对齐,然后利用欧式距离、绝对值距离或高斯距离计算每对对应点的代价,然后将所有对应点的代价相加。
上述技术方案中,所述步骤3)中,所述子序列的长度可以是该子序列所对应的旋律段的时间长度。
上述技术方案中,所述步骤3)中,所述门限值在1至5秒范围内选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710178220.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:SF6高压断路器电磁力驱动机构
- 下一篇:城市自行车租赁管理方法和系统





