[发明专利]一种基于ShuffleNet的中文歌词情感分析方法在审
申请号: | 202111517157.8 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114218942A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 谢强;林巧民;沈慧琳;周斌;洪磊 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/216;G06N3/04 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 shufflenet 中文歌词 情感 分析 方法 | ||
本发明是一种基于ShuffleNet的中文歌词情感分析方法,包括步骤1:对歌词文本数据集进行预处理;步骤2:使用jieba分词工具对歌词文本进行分词并去除停用词;步骤3:对分词之后的结果进行词嵌入,将其转换为向量的形式;步骤4:构建ShuffleNet网络,通过ShuffleNet网络得到score1;步骤5:构建歌曲情感词典;步骤6:将步骤2得到的分词之后的结果通过情感词典和计算规则计算出情感得分,并通过softmax函数得到score2;步骤7:将score1和score2进行融合,从而得出最终情感得分。本发明提升了对中文歌词情感分析的准确率,从而更准确的对歌曲进行分类。
技术领域
本发明属于自然语言处理领域,具体的说是涉及一种新的基于 ShuffleNet和情感词典的中文歌词情感分析方法。
背景技术
近年来,随着计算机与互联网的迅猛发展。音频、图像、文本等多媒体 数据呈爆炸性增长,歌曲便是其中之一。歌曲作为人们的情感载体之一,已 成为人们生活中不可或缺的一部分。如何有效的解决在线音乐资源检索、管 理和歌曲推荐等问题已成为一项难题。因此需要一种高效并且准确的方法对 歌曲进行情感分析,从而达到分类目的。
在歌曲数量不多的情况下,歌曲分类可采用人工的方式进行,这种方式 虽然准确率高,但是效率却很低。因此,需要借助计算机来自动的进行分类。 近年来,歌曲的种类层出不穷,从以往的古典音乐到如今的流行音乐,歌曲 的形式已发现翻天覆地的变化。在以往,音频相较于歌词是更加重要的衡量 歌曲情感的因素。现如今歌词内容愈发丰富,并已成为众多流行音乐作者的 一个非常重要的情感抒发途径。因此,基于歌词对歌曲进行情感分析来对歌 曲分类已成为一种可能。
杨小平、张中夏、王良、张永俊、马奇凤、吴佳楠、张悦等在中国人民 大学信息学院期刊上公开了基于Word2Vec的情感词典自动构建与优化,基 于Word2Vec构建音乐情感词典,并构建基于TF-IDF的特征向量来对歌曲进 行分类,通过构建情感词典,并采用VSM将文本转换为向量,最终通过SVM 进行分类,采取基于情感向量空间和情感单元,并结合情感词频和Thayer二 维情感压力模型来进行情感分析。以上都采用基于词频和文本特征等机器学 习方法,虽然有着较高的准确率,但是有特征标注工作量大和无法联系上下 文等问题。因此卷积神经网络等深度学习被广泛使用。然而,随着模型层数 的加深,出现了参数多、梯度消失及爆炸等问题,导致模型难以训练。
发明内容
针对现有技术的不足,本发明提供了一种新的基于ShuffleNet和情感词典 的中文歌词情感分析方法。针对现有ShuffleNet模型分析文本精度不足的问 题,本发明借助情感词典并通过情感词、程度副词和否定词的权值以及相应 的情感得分计算方式来弥补精度不足的问题;并使用D-S证据理论融合了从 ShuffleNet模型和情感词典获取的两个特征,从而提高了情感分析的准确性。
为了达到上述目的,本发明是通过以下技术方案实现的:
本发明是一种新的基于ShuffleNet和情感词典的中文歌词情感分析方法, 该方法包括以下步骤:
步骤1:对歌词文本数据集进行预处理,包括去除文本中的无用信息。
对歌词文本数据集进行预处理是指将从网络上通过爬虫和抓包而获取到 的数据集在输入到模型前,先去除数据集中的一些无用信息,包括作者、时 间、空格、换行和无关符号。其目的是减少无用信息对结果的影响。
步骤2:使用jieba分词工具对歌词文本进行分词并去除停用词。
使用jieba分词工具对文本进行处理是指将文本处理为一个个词的形式, 并将词中的停用词去除。
步骤3:对分词之后的结果进行词嵌入,将其转换为向量的形式。所述步 骤3中对分词之后的结果使用词嵌入是指将步骤2和步骤1处理之后得到的 文本转换为一个个向量的形式,便与模型进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111517157.8/2.html,转载请声明来源钻瓜专利网。