[发明专利]一种人工智能作曲方法和系统有效
| 申请号: | 202110764850.9 | 申请日: | 2021-07-07 | 
| 公开(公告)号: | CN113611265B | 公开(公告)日: | 2022-09-23 | 
| 发明(设计)人: | 朱春霖;田旭航;廖勇;夏雄军 | 申请(专利权)人: | 湖南师范大学 | 
| 主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/30 | 
| 代理公司: | 长沙麓创时代专利代理事务所(普通合伙) 43249 | 代理人: | 贾庆 | 
| 地址: | 410081*** | 国省代码: | 湖南;43 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 人工智能 作曲 方法 系统 | ||
1.一种人工智能作曲方法,其特征在于:包括如下步骤:
步骤一,构建预处理模块,将包含若干音乐文件的训练集输入预处理模块得到训练集的音乐文件中的音乐信息并保存为钢琴卷帘格式;所述音乐信息包括音符、音高、起始时间以及音符的时值;
步骤二,通过预处理模块,对所述音乐信息进行清洗,切分成预设长度范围的音乐片段,删除超出预设音高范围的音符;
步骤三,构建数据转换模块,将当下的音乐信息与上一个时间点输入的音乐信息,共同编码为其相应的潜在信息,并保存在潜在空间中;
所述数据转换模块由多个单层双向GRU网络组成,每个时序片段的单层双向GRU网络同时向前一个时序和后一个时序的传递参数,也接受前一个时序和后一个时序的参数;完成对所有音乐特征信息的提取后,由第一个时序的单层双GRU网络和最后一个时序的单层双GRU网络将所有音乐特征信息编码为相应的潜在信息,并保存在潜在空间中;所述潜在信息为数据转换模块提出来的音乐特征信息,所述潜在空间为所有保存潜在信息的变量的集合,为一个或多个一维数组;
步骤四,构建音乐生成模块,提取潜在空间中的低维信息,产生新的音乐信息,将音乐信息进行筛分,并保存为不同音轨,不同乐器的音乐,实现自动作曲;数据转换模块和音乐生成模块构成变分自编码器;数据转换模块作为变分自编码器的编码器网络,音乐生成模块作为变分自编码器的解码器网络;
步骤五,构建音乐评估模块,设置奖励函数,将音乐生成模块输出的音乐与真实音乐进行对比,指导音乐生成模块下一轮的音乐生成;音乐生成模块与音乐评估模块构成GAN神经网络,音乐生成模块作为GAN神经网络的生成器,音乐评估模块作为GAN神经网的鉴别器;
步骤六,在音乐生成模块经多轮训练后,输出效果稳定时,音乐生成模块生成的音乐即为智能作曲作品。
2.如权利要求1所述的人工智能作曲方法,其特征在于:GAN神经网络的目标函数为:
其中,D表示音乐评估函数,G表示音乐生成函数;x表示真实数据输入,Ex~pdata(x)表示从分布pdata中采样x;data表示真实数据,pdata(x)表示真实数据data的分布;z表示噪声数据,pz为噪声数据所服从的分布,pg为生成数据所服从的分布;D(x)表示x在服从padata分布时x的期望,输出为一个最大值为1,最小值为0的值;λ为惩罚项的参数。
3.如权利要求1所述的人工智能作曲方法,其特征在于:所述音乐生成模块由一种分层次的GRU网络构成,其结构为一层U个GRU网络和一层U×n个GRU网络;所述GRU网络,有两个门控制单元,一个更新门,和一个重置门;
构成函数如下
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
yt=σ(Wo·ht)
其中:zt表示t时刻的更新门,rt表示t时刻的重置门,表示t时刻的候选激活状态,ht表示t时刻的激活状态,ht-1表示(t-1)时刻的隐层状态,xt表示t时刻的输入,σ表示激活函数,Wr、Wz、Wh、Wo均为要学习的权重参数;更新门z由当前状态需要被遗忘的历史信息和接受的新信息决定;重置门r由候选状态从历史信息中得到的信息决定;更新门控制前一时刻有多少信息传递到当前状态,更新门的数值越大则传递的信息越多;而重置门则控制前一状态有多少信息被输入进当前状态下,重置门越大,则写入当前状态的信息越多。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110764850.9/1.html,转载请声明来源钻瓜专利网。





