[发明专利]一种分离用户和产品注意力机制的文本情感分类方法在审

专利信息
申请号: 201811071402.5 申请日: 2018-09-14
公开(公告)号: CN109325120A 公开(公告)日: 2019-02-12
发明(设计)人: 申影利;马勇;顾明亮;张秋显 申请(专利权)人: 江苏师范大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06F17/27
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 康燕文
地址: 221116 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 句子特征 文档特征 文本情感分类 注意力机制 分离用户 记忆模型 情感分类 提取模块 用户文档 文本 预处理 产品属性 分词处理 情感识别 文本特征 用户个性 词向量 第一层 向量化 拼接 分类
【说明书】:

发明公开了一种分离用户和产品注意力机制的文本情感分类方法,首先,预处理待分类的文本;将处理后的文本向量化;其次,建立注意力机制模块;建立句子特征提取模块,用于接收分词处理后的文本的词向量,并输入到第一层双向长短时记忆模型中,分别得到用户句子特征和产品句子特征;建立文档特征提取模块,用于接收两类句子特征,并输入到第二层双向长短时记忆模型中,再次得到用户文档特征和产品文档特征;然后,将用户文档特征和产品文档特征进行拼接,得到综合的文档特征;最后,输入情感分类模块,进行情感分类。采用本发明,分别考虑用户个性和产品属性,在文本情感分类中的影响,可提高文本特征描述的准确性,从而提高情感识别的正确性。

技术领域

本发明涉及自然语言处理领域,具体涉及一种分离用户和产品注意力机制的文本情感分类方法。

背景技术

目前,文本情感分类被广泛用于在线评论网站(如淘宝和微博),对于评论文本的情感分类研究侧重于向用户推荐符合用户个性化的产品。其中,按照处理文本的粒度不同,情感分析可分为文档级、句子级、属性级等。本发明主要对文档级别的文本进行情感分析,对文本中蕴含的情感,从整体上进行分析、处理、归纳和推理,以此来获得用户的总体情感倾向。

传统的深度学习方法只是关注评论内容的重要性,而忽略用户个性和产品属性的信息。尽管少数模型将用户和产品信息考虑在内,也提高了文本情感分类的准确性。但它们通常是将用户和产品信息加入文本中一起输入模型训练,没有单独考虑二者信息在情感分类中的影响作用。

然而,在评论文本中,首先,我们观察到一些词语或句子侧重体现用户的个性,其他一些则倾向表明产品的属性,这两种信息在识别文本情感标签中产生不同的影响。比如,“这家酒店环境很好,而且我很喜欢这种现代的装修风格”。其中,词语“好、现代的”是用户的观点,表明产品—酒店的属性,而词语“好”是用户表达的情感,强烈体现了用户的个性,即对产品的态度是苛刻还是宽容,如果用评分制度来衡量,对于同一商品,苛刻的用户倾向给低分,宽容的用户倾向给高分。总之,评论观点更多地与产品属性相关联,而评论情感更多与用户个性有关。其次,并非所有词语、句子对于不同用户和不同产品的评论文本语义都有同等作用。因此,首先需要将用户个性和产品属性信息分离开来,运用注意力机制来提取用户个性和产品属性信息。最终,针对文档是由句子、句子是由词语组成的层次结构,因此设计神经网络模型是层次结构的双向长短时记忆模型,以此来映射文档的层次结构。这样不仅能提高文本情感分类的效率、准确性和容错性,而且能满足大规模语料处理的需求。

发明内容

发明目的:本发明提出了一种分离用户和产品注意力机制的文本情感分类方法,使得情感分类具有更好的针对性和精准性。

技术方案:本发明所述的一种分离用户和产品注意力机制的文本情感分类方法,包括以下实现步骤:

(1)预处理待分类的文本;

(2)将处理后的文本向量化;

(3)建立注意力机制模块;

(4)句子特征提取模块,用于接收分词处理后的文本的词向量,并输入到第一层双向长短时记忆模型中,分别得到用户句子特征和产品句子特征;

(5)文档特征提取,用于接收句子特征,并输入到第二层双向长短时记忆模型中,分别得到用户文档特征和产品文档特征;

(6)将用户文档特征和产品文档特征进行拼接,得到综合的文档级别特征;

(7)将步骤(6)所得综合的文档特征输入情感分类模块,进行情感类型识别。

所述步骤(1)包括以下步骤:

(11)将待处理的文本切分成词语或者字的形式,得到分词后的文本;

(12)根据文本数据的特征,对公开的停用词表进行修改,生成新的停用词表;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏师范大学,未经江苏师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811071402.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top