[发明专利]一种基于共同语义空间的个性化音乐生成方法及装置有效
| 申请号: | 201710004391.8 | 申请日: | 2017-01-04 |
| 公开(公告)号: | CN106898341B | 公开(公告)日: | 2021-03-09 |
| 发明(设计)人: | 王东;张记袁;冯洋;杜新凯;游世学 | 申请(专利权)人: | 清华大学;北京中科汇联科技股份有限公司 |
| 主分类号: | G10H7/00 | 分类号: | G10H7/00 |
| 代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙) 11417 | 代理人: | 李文军 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 共同 语义 空间 个性化 音乐 生成 方法 装置 | ||
1.一种基于共同语义空间的个性化音乐生成方法,其特征在于:包括以下步骤:
S1、将文字映射到共同语义空间表示;
S2、将共同语义空间表示转化为乐曲;
S3、将文字蕴含的风格和意境隐含到语义空间表示中,并体现在生成的乐曲中;
所述的共同语义空间是指将文字和音乐映射到在同一个语义空间中;
具体包括以下步骤:
A、输入输出格式如下:
文字对应的输入格式:
音符对应的输出格式:
其中:
Kx和Ky分别是文字和音符的字符个数,Tx和Ty分别是一段文字和对应音符的长度;B、对于encoder;
在encoder阶段使用bidirectional recurrent neural network构建,下面是生成正向隐层的步骤:
其中:
是文字字符对应的词向量矩阵;和是权重矩阵;是偏置向量,m是词向量的维度,n是隐层数;
反向隐层通过相似的计算获得;
拼接正向和反向隐层向量获得如下所示:
C、对于decoder:
在Decoder阶段,生成隐层状态设为st的步骤,如下:
其中:
是音符字符对应的词向量矩阵,Wo,WC,Wi,Wf∈Rn×m,Uo,UC,Ut,Uf∈Rn×n和是权重矩阵,是偏置向量,m是词向量的维度,n是隐层数;
生成下一个音符条件概率的公式如下:
yt=arg maxyp(y|st,c,yt-1) (16)
D、代价函数:
使用交叉熵代价函数:
2.根据权利要求1所述的一种基于共同语义空间的个性化音乐生成方法,其特征在于:所述的步骤S1和S2均通过基于RNN的编码器来实现。
3.实现如权利要求l或2所述的一种基于共同语义空间的个性化音乐生成方法的装置,其特征在于,包括将文字映射到共同语义空间表示的影射模块和用于将共同语义空间表示转化为乐曲的转化模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京中科汇联科技股份有限公司,未经清华大学;北京中科汇联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710004391.8/1.html,转载请声明来源钻瓜专利网。





