[发明专利]一种人工智能作曲方法和系统有效
| 申请号: | 202110764850.9 | 申请日: | 2021-07-07 |
| 公开(公告)号: | CN113611265B | 公开(公告)日: | 2022-09-23 |
| 发明(设计)人: | 朱春霖;田旭航;廖勇;夏雄军 | 申请(专利权)人: | 湖南师范大学 |
| 主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/30 |
| 代理公司: | 长沙麓创时代专利代理事务所(普通合伙) 43249 | 代理人: | 贾庆 |
| 地址: | 410081*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 人工智能 作曲 方法 系统 | ||
本发明公开一种人工智能作曲方法和系统。本发明涉及计算机应用技术领域。所述方法包括:获取训练集中的音乐信息,保存为钢琴卷帘格式,所述音乐信息包括音符、音高、起始时间以及音符的时值;对所述音乐信息进行清洗,切分为4小节乐句,删除超出音高范围的音符;将当下的音乐信息与上一个时间点输入的音乐信息,共同编码为其相应的潜在信息,并保存在潜在空间中;从潜在空间中提取低维音乐特征信息,产生新的音乐信息,将音乐信息进行筛分,并按照不同音轨进行输出,实现智能作曲;将生成的音乐与真实音乐进行对比,指导下一轮的音乐生成;在多轮训练后,输出效果趋于稳定时,音乐生成模块生成的音乐即为该实例的输出。
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种人工智能作曲方 法和系统。
背景技术
音乐无疑对于当今社会具有十分特殊的意义,也是日常生活中必不 可少的一部分。随着计算机相关技术的发展和普及,计算机音乐领域应 运而生。而使用神经网络进行智能作曲作为计算机音乐领域中的新兴方 向,也得到了研究人员乃至商业公司的高度重视。
现有神经网络作曲方法,主要是基于循环神经网络(RNN,Recurrent NeuralNetwork),变分自动编码器(VAE,Variational Autoencoder)或 者生成对抗网络(GAN,Generative Adversarial Network)实现的。但是, 基于单一类型神经网络的计算机作曲方法只适合用于乐曲长度短的情 况,同时各类神经网络都着其典型缺点,其作曲效率随乐曲长度的增长 呈指数下降。递归神经网络存在着梯度消失和梯度爆炸的问题,生成的 音乐缺乏规则性和连贯性。生成对抗网络生成的音乐可听性较差,生成 质量不稳定。变分自动编码器在生成多音阶或者长序列音乐时,生成效 率低,生成音乐可听性差。
名词解释:
freezen机制:一种训练机制,在GAN网络中,当生成器或者鉴别 器被训练的异常强大以至于对方的梯度消失,无法正常进行训练时,对 过于强大的一方实施冻结。
KL散度:相对熵,如果对于同一个随机变量x有两个单独的概率 分布P(x)和Q(x),可以用KL散度(相对熵)来衡量这两个分布的差异。
tanh激活:在神经网络中,我们会对所有的输入进行加权求和,之 后我们会在对结果施加一个函数,这个函数就是我们所说的激活函数, 使用激活函数时为了让中间输出多样化,能够处理更复杂的问题。tanh 正是一种激活函数,为双切正切曲线,过(0,0)点。函数公式为:
softmax输出层:softmax是一种分类器,用于分类过程,用来实现 多分类的,它把一些输出的神经元映射到(0-1)之间的实数,并且归 一化保证和为1,从而使得多分类的概率之和也刚好为1。函数公式为:
其中,Vi是分类器前级输出单元的输出。i表示类别索引,总的类 别个数为C。Si表示的是当前元素的指数与所有元素指数和的比值。通 过Softmax函数就可以将多分类的输出数值转化为相对概率。
发明内容
本发明针对几种现有神经网络作曲方法的不足,提出了一种人工智 能作曲方法和系统,将循环神经网络、变分自动编码器、生成对抗网络 组合成混合神经网络,然后将训练生成的音符向量输入该作曲网络,可 以提高音符生成的准确性,长音乐的生成质量,且可以实现和声的生成。
一种人工智能作曲方法,包括如下步骤:
步骤一,构建预处理模块,将包含若干音乐文件的训练集输入预处理模 块得到训练集的音乐文件中的音乐信息并保存为钢琴卷帘格式;所述音 乐信息包括音符、音高、起始时间以及音符的时值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110764850.9/2.html,转载请声明来源钻瓜专利网。





