[发明专利]一种融合颜文字的多类别情感提取方法在审
申请号: | 202110412378.2 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113191135A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 骆曦;刘晓晓 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/284;G06F40/44;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙) 11367 | 代理人: | 蒋路帆 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 文字 类别 情感 提取 方法 | ||
本发明提供一种融合颜文字的多类别情感提取方法,包括对文本集进行预处理,还包括以下步骤:将预处理完成的文本集放入Word2Vec中的Skip‑Gram模型进行训练,将词的上下文关系嵌入到低维空间,得到所有词语对应的词向量;构建颜文字情感词典;计算文档中颜文字情感概率;计算文本情感概率;计算文档综合情感概率。本发明通过计算相似度提取颜文字的多种情感概率并生成颜文字情感词典,通过计算文档颜文字情感概率,在文本的基础上融合了颜文字情感信息,以帮助提高用户情感提取的全面性和准确性,进而提高决策的准确率,同时利用神经网络和循环神经网络的高效性和强大的特征学习能力为情感提取提供可靠的依据,降低了人工构建情感词典和规则的依赖。
技术领域
本发明涉及自然语言处理技术与情感分析的技术领域,特别是一种融合颜文字的多类别情感提取方法。
背景技术
随着信息技术和网络技术的发展,社交媒体已成为现代人们相互交流和信息传递的主要平台,如论坛、微博、在线评论等,每天都涌现大量的富含主观情感的信息。通过分析用户发表的信息,能够识别其中隐含的情感信息,并且能够发现用户情感的演化规律,进行有价值的信息预测,这在互联网信息挖掘中具有重要价值。情感分析是指利用自然语言处理、文本分析和计算语言学等方法分析人们的观点、情感、评价、态度和情绪等信息,其主要目的是基于挖掘结果进行有价值的信息预测,并将预测结果以更直观的方式展示出来。近年来,情感分析技术在市场营销、舆论监控、政策分析、公共关系管理方面都有广泛的应用,具有较高的经济和社会价值。
现有情感分析技术的手段主要有两种:
(1)基于情感词典的方法:情感词对于文本情感倾向的表达起着重要作用,基于词典的方法主要是运用情感词的相关信息进行情感倾向判别。通过制定情感词典、利用句子语法和词语出现位置等规则,对文本进行拆句、分析及匹配词典,对情感词进行加权,最后使用情感值作为文本的情感倾向判断的依据。情感词典的准确率高,但存在召回率比较低的情况;规则和词典的构建和完善需要大量人力,其质量决定了情感分析质量,对于不同的领域,构建情感词典的难度不同,精准构建的成本较高;此外,该方法未考虑词语上下文对情感变化的影响。
(2)基于机器学习的方法:将其作为有监督分类问题,用已标注的文本训练模型,然后使用训练好的模型预测未标注文本的情感极性,目前较为成熟。卷积神经网络(CNN)利用多个卷积核进行卷积计算,可以从不同角度较好的提取文本的局部特征,但不能解决长文本的上下文依赖。长短期记忆网络(LSTM)是循环神经网络的一种,使用了三门设计方法,能够利用文本序列的能力捕捉到用户不断变化的情绪,但识别局部特征的能力较弱。
颜文字是一种基于字符的表情符号,利用计算机字符码表中特定字符的显示外观,编排其组合次序,形成描绘人物表情动作的图案。在社交媒体中,有越来越多的人频繁使用颜文字来表达和抒发丰富的内心情感,它丰富了网络交流的想象空间,深受年轻用户的喜爱,目前已发展成为影响世界的网络文化符号。颜文字的使用会带来语义和语境情感上的变化,因此传统的单纯基于文本的情感分析已经无法满足需要,需要结合颜文字为用户情感决策提供更多、更准确的信息,进而提高决策的准确率。
申请号为201910976409.X的发明专利申请公开了一种基于模型融合的多类别情感分类方法,首先利用Bert模型在数据预处理方面的突破性进展对训练文本集进行预处理,与类别标签数据结合,获取文本的特征向量,将非结构化的文本数据转化成结构化的训练集合,再转化为Liblinear模型的标准输入数据,进行分类模型的构建。该方法的缺点是需要较大的数据集用于调整和预训练,没有考虑文本中颜文字的影响,且在捕捉句子顺序信息方面的能力较差,无法获取更加复杂的语义特征。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110412378.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摄像机
- 下一篇:供热/冷系统虚拟储能能力计算方法、装置与电子设备