[发明专利]一种基于ShuffleNet的中文歌词情感分析方法在审
申请号: | 202111517157.8 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114218942A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 谢强;林巧民;沈慧琳;周斌;洪磊 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/216;G06N3/04 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 shufflenet 中文歌词 情感 分析 方法 | ||
1.一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:所述情感分析方法包括如下步骤:
步骤1:对歌词文本数据集进行预处理,去除文本中的无用信息;
步骤2:将经过步骤1之后得到数据通过使用jieba分词工具对歌词文本进行分词并去除停用词;
步骤3:对分词之后的结果进行词嵌入,将其转换为向量的形式;
步骤4:构建ShuffleNet网络,将步骤3得到的结果通过ShuffleNet网络,并将输出的结果通过激活函数得到score1;
步骤5:构建歌曲情感词典;
步骤6:将步骤2得到的分词之后的结果通过步骤5构建的情感词典和相应的计算规则计算出情感得分,并通过softmax函数得到score2;
步骤7:将经过步骤4和步骤6得到的score1和score2通过D-S证据理论进行融合,从而得出最终情感得分。
2.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:在所述步骤4中具体包括如下步骤:
步骤4-1:将步骤3得到的词嵌入结果进行resize,将其固定为大小为256×256的矩阵;
步骤4-2:在ShuffleNet的输入层进行一次卷积转为3通道的输入;
步骤4-3:开始构建ShuffleNet网络,ShuffleNet网络由两种模块组合而成;
步骤4-4:构建完成之后得到输出的结果为一个向量,将其通过激活函数,转换为0到1区间的值score1。
3.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:所述步骤5构建歌曲情感词典具体包括如下步骤:
步骤5-1:构建程度副词词典:根据知网(Hownet)情感词典来构建程度副词,并将其分为极高、高、中、低3类,权值分别为2、1.75、1.5、1.25;
步骤5-2:构建否定词典:收集否定词,将否定词权重设为-1,并且当文本中否定词的个数为奇数时,表示该文本为否定,当文本中的否定词个数为偶数时,表示该文本为肯定;
步骤5-3:构建歌词情感词典:将音乐中的情感类别按照-V+A、+V+A、-V-A、+V-A四个类别进行分类,其中:-V+A表示:生气、愤怒、惊恐;+V+A表示开心、兴奋;-V-A表示伤心、低落;+V-A表示放松、平静。
4.根据权利要求5所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:步骤6中根据情感词典和相应的计算规则的出情感得分score2是指:歌词文本的词与歌曲情感词典中的+V+A类别匹配时得分+1,与+V-A类别匹配时得分+0.5,与-V+A类别匹配时得分-1,与-V-A类别匹配时得分-0.5,从文本开头开始遍历,如果一个情感词前面存在程度副词,那么用程度副词的权重乘情感词的分数;若程度副词的前面存在否定词,,那么将情感词的得分、否定词的权重和程度副词的权重相乘,遍历整个歌词文本,将所有结果进行累加得到基于情感词典的总分,将得到的总分通过激活函数转换为0到1区间的数,记为score2。
5.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:所述步骤7中的D-S证据理论的融合规则为:
其中A表示融合之事件,表示融合之后的概率,B和C表示两个维度的概率即score1和score2,K为归一化系数,表达式为:
6.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:所述步骤3中对分词之后的结果进行词嵌入是指使用word2vec将步骤2得到的结果中的每一个词转换为向量的形式。
7.根据权利要求1所述一种基于ShuffleNet的中文歌词情感分析方法,其特征在于:在所述步骤1中对歌词文本数据集进行预处理是指使用抓包和爬虫的方式获取各大音乐APP上不同种类歌曲的歌词作为实验数据集,去除数据集中的作者、时间、无关符号、空格和换行信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111517157.8/1.html,转载请声明来源钻瓜专利网。