[发明专利]一种基于编码-解码网络的音乐伴奏自动生成方法及其系统有效
申请号: | 202010795908.1 | 申请日: | 2020-08-10 |
公开(公告)号: | CN111653256B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 赵洲;何金铮;任意 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G06N3/08;G06N3/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 解码 网络 音乐 伴奏 自动 生成 方法 及其 系统 | ||
本发明公开了一种基于编码‑解码网络的音乐伴奏自动生成方法及其系统,属于音乐设计领域。主要包括如下步骤:1)针对给定的原始音乐数据,训练由多编码器构成的编码神经网络进行编码,学习多轨(或者单轨)音乐的特征。2)对于编码完成得到的编码器输出的多轨(或者单轨)音乐特征与最后得到的音乐联合训练由多解码器构成的解码神经网络。相比于传统的基于序列模型的方法,本发明利用长距离缓存机制更好地建模了长音乐,同时本发明利用编码‑解码网络实现了更加迅速地训练过程。本发明在多轨(或者单轨)音乐伴奏问题中所取得的效果相比于传统的方法更好。
技术领域
本发明涉及音乐设计领域,尤其涉及一种基于编码-解码网络的音乐伴奏自动生成方法及其系统。
背景技术
音乐是一种艺术形式和文化活动,其媒介是按时组织的声音。一般音乐的定义包括共同元件,例如音调(其支配旋律和和声),节奏(及其相关联的概念节奏,米,和关节),动态(响度和柔软性),和的声波品质音色和纹理(这是有时称为音乐声的“颜色”)。不同样式或类型音乐可能会强调、不强调或忽略其中的某些元素。音乐是用各种各样的乐器和声乐技术演奏的。在音乐技术的各种领域中,音乐的伴奏问题是一个很有挑战性的问题,自动伴奏技术旨在解决给定主音轨生成伴奏音轨的问题。随着人工智能和深度学习技术的快速发展,许多自动伴奏方法被提出。
现有报道中提出了一种基于生成对抗网络的自动伴奏技术。这种方法将MIDI看做钢琴卷帘图,横轴为时间,纵轴为音高,用0和1表示当前位置和音高上有无音符触发,同时在生成音乐的过程中将图像领域广泛使用的生成对抗网络技术引入,通过设计多轨模型和时序模型,来解决音乐伴奏问题。多轨模型负责多轨道的相互依赖性,而时序模型处理时序依赖性。但是由于钢琴卷帘图的数据比较稀疏,训练很不稳定,实验结果也表明这种方法生成的音乐伴奏质量有限。
同时,在自动作曲领域,前人也提出了很多基于序列模型的方法,但仅仅采用了一种解码器对一种音轨进行解码,只能实现针对单轨音乐进行续写,无法实现音乐的自动伴奏。
综上所述,目前主流的自动伴奏和自动作曲技术无法满足生成高质量多轨自动伴奏的要求,这成为当前自动伴奏领域的巨大问题。
发明内容
本发明的目的在于解决现有技术中的问题,为了克服现有技术中无法很好地生成高质量的自动伴奏的不足,本发明提供一种基于编码-解码网络的音乐伴奏自动生成方法及其系统。
本发明所采用的一种基于编码-解码网络的音乐伴奏自动生成方法,包括如下步骤。
1)获取源音乐训练集,每一个音乐作为一个训练样本,训练样本被标注为主音轨和伴奏音轨。
2)建立编码-解码网络结构,包括编码神经网络和解码神经网络,所述的编码神经网络由多个编码器构成,解码神经网络由多个解码器构成。
3)根据不同的音乐格式,读取源音乐并编码成不同的初始音乐表征,得到源音乐编码表征;随后从源音乐编码表征中获取主音轨语句(x1,…,xM)和源音乐编码表征语句的伴奏音轨(y1,…,yN),其中xi表示主音轨语句中的第i个符号,M表示主音轨语句中符号的数量,yi表示源音乐的伴奏音轨语句中第i个音符,N表示伴奏音轨中音符的数量,最后通过词嵌入将主音轨(x1,…,xM)和伴奏音轨(y1,…,yN)转成嵌入向量。
4)将主音轨的嵌入向量输入到编码器神经网络进行N步编码,在编码过程中,将主音轨语句中位于前面的符号在编码器中计算得到的隐藏层序列存储至缓存中,并将缓存中的数据引入到后面符号的编码过程中,重复编码N次,得到编码器的输出作为主音轨编码后的音乐表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010795908.1/2.html,转载请声明来源钻瓜专利网。