[发明专利]基于Gamma分布分析的音乐连续情感特征分析评价方法有效
申请号: | 201710791753.2 | 申请日: | 2017-09-05 |
公开(公告)号: | CN107578785B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 李海峰;马琳;薄洪健;丰上;李洪伟;刘全胜;信家男 | 申请(专利权)人: | 哈尔滨工业大学;深圳航天科技创新研究院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63 |
代理公司: | 哈尔滨市哈科专利事务所有限责任公司 23101 | 代理人: | 吴振刚 |
地址: | 150001 黑龙江省哈尔滨市*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gamma 分布 分析 音乐 连续 情感 特征 评价 方法 | ||
1.一种基于Gamma分布分析的音乐连续情感特征分析评价方法,其特征在于,具体步骤如下:
步骤一:计算音乐特征和情感标签之间的相关性;
设音乐信号为Ai,1≤i≤N,N为样本个数,在用户听音乐的过程中的Valence和Arousal情感标签为上,其采样率为2Hz,
(1)首先对音乐信号进行加窗、分帧,音乐情感分析长度取窗长w为4秒,帧移为0.5秒;
(2)其次,音频特征提取,设特征Fij,1≤j≤M,M为特征维数,提取音高、响度等音乐底层特征,以及旋律、节奏等高层语义特征;
(3)计算每一维特征Fij与打分L的Pearson相关系数,得到Pearson相关系数矩阵R,计算公式如下:
步骤二:基于Gamma分布的特征筛选方法;
由于相关系数是从0到1之间,且分布离1越近表示相关性大,分布离0越近表示相关性小,因此进行两次Gamma分布拟合去掉相关性小的,保留相关性较大的特征,
(1)首先,计算每一维特征在所有样本上相关系数的直方图;
(2)其次,对相关系数直方图进行Gamma分布拟合,在这里特定特征的相关系数为ri,i=1,2,...,n,其中n为样本个数,先对相关系数直方图进行Gamma分布拟合,根据Gamma分布的定义,得到概率密度函数拟合公式如下:
其中α为Gamma分布的形状参数,决定Gamma分布的陡峭程度,λ=1/β为Gamma分布的尺度参数,决定Gamma分布的散布程度;
(3)再对相关系数直方图进行轴对称操作,即对轴对称后的相关系数直方图进行Gamma分布分析,得到拟合参数和
(4)根据两次Gamma拟合的参数构造相关性影响因子IF,对所有特征按IF从大到小排序,筛选出前K个最相关特征构成特征子集Fs,s=1,…,K;
步骤三:建立情感感知概率矩阵EDM
(1)建立特征相似度矩阵FDM
首先对上一步筛选出的K维特征及情感打分进行分帧,取帧长为4秒,帧移为3秒,对情感特征的每一帧和对应的情感打分构建N×N的相似度矩阵FDM,构建方法如下:
设第t帧样本为A1,A2,...,AN,且顺序确定,其特征为F1,F2,...,FK,则:
FDMpg=dist(Fpk,Fqk),1≤p,q≤N
其中Fik表示第i个样本的第k维特征的特征向量,表示X和Y的欧式距离,经过这一步计算,得到K个特征相似度矩阵FDMi,i=1,...,K;
同样方法,设第t帧样本对应的打分为L1,L2,...,LK,对打分也求得一个相似度矩阵LDM;
LDMpg=dist(Lp,Lq),1≤p,q≤N
(2)情感感知概率矩阵EDM
为了衡量相应的特征差异,对每一帧的FDMi和LDM计算矩阵相似度,计算方法如下:
那么,在T帧中,用每一帧都用如上方法计算特征差异概率,并归一化,就构成了情感感知概率矩阵EDM,计算方法如下:
EDMtk=ρ′k(t)
步骤四:计算情感变化最长路径,构造回归预测模型对维度情感进行预测;
(1)情感最大路径计算方法
在T帧中,用每一帧的特征矩阵与概率矩阵EDM相乘,构成新的情感特征矩阵FDM‘,在情感特征矩阵中,用最大权值路径作为特征向量,求解最大权值路径的问题,转化为求子问题的最优解,使用动态规划算法,记录了已求解过的子问题结果,设Pathi,j是对矩阵的描述,则其状态转移方程写为:
MPi,j=max{MPi-1,j,MPi,j+1}+MPi,j
其中MPi,j表示走到第i行第j列的最大权值,那么MPi,j的最优解包含子问题MPi-1,j和MPi,j+1的最优解,其中MP0,n-1=Path0,n-1,最大的路径权值通过比较底层的分数求得;
(2)基于Lasso回归的音乐连续情感预测方法
首先,在前面特征选择的基础上,设最优特征集为Fk,k=1,2,...,K,在最优特征集上,分别对Valence和Arousal建立回归预测方程:
Y=Xβ+μ
其中X为特征集,Y为Valence或Arousal的平均打分,μ为随机误差项;
其次,基于Lasso回归模型,对预测方程进行求解,求得取得最小时的拟合系数;
在求解拟合系数时,约束条件取最小的λ或SE值,取最小值为约束条件;最后,在最优拟合系数的基础上对新的未知样本经行Valence和Arousal的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;深圳航天科技创新研究院,未经哈尔滨工业大学;深圳航天科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710791753.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种从音频中提取目标源的方法及装置
- 下一篇:一种光盘存储和分盘装置