[发明专利]一种基于用户评分的情感词典构建方法有效
| 申请号: | 201910682361.1 | 申请日: | 2019-07-26 | 
| 公开(公告)号: | CN110489522B | 公开(公告)日: | 2022-04-12 | 
| 发明(设计)人: | 杨胜刚;陈佐;李新;田浩;杨申燕;朱桑之;谷浩然;杨捷琳 | 申请(专利权)人: | 湖南大学 | 
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/30 | 
| 代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 邹大坚;胡君 | 
| 地址: | 410082 湖南省长沙市*** | 国省代码: | 湖南;43 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 评分 情感 词典 构建 方法 | ||
1.一种基于用户评分的情感词典构建方法,其特征在于,步骤包括:
S1.初始标记:选取指定互联网平台中目标用户的部分评论数据并设置情感标签以进行标记,得到标签数据,所述评论数据包括对商品的评分以及评价文本数据;
S2.标签传播:将每个目标用户的评论数据中具有相同或相似评分的评论数据标记为具有情感相似关系,并按照所述情感相似关系将所述情感标签进行传播,得到扩充后的标签数据;
S3.词典构建:基于所述扩充后的标签数据进行情感信息提取,构建得到所需情感词典以用于对指定互联网平台中用户情感进行分类;
所述步骤S3中,还包括提取全局情感词共现信息,并融合所述全局情感词共现信息以及基于用户评分提取的情感词共现信息,最终得到融合的情感词共现信息,基于融合的情感词共现信息构建情感词典;
所述融合所述全局情感词共现信息以及基于用户评分提取的情感词共现信息的具体步骤为:
分别提取出全局共现以及基于用户评分共现情况下所有情感词对的PMI值,汇总所有的情感词共现信息,令情感词的个数为num,构建一个num*num的情感词共现信息矩阵PMISim,矩阵的行标和列标为同一定排列顺序的情感词,矩阵的值为情感词共现得分;PMISimglobal(wi,wj)表示提取全局情感词对(wi,wj)的全局情感词共现信息,使用全局情感词共现信息构建一个与PMISim对应的num*num的全局情感词共现矩阵PMISimglobal;PMISimsamescore(wi,wj)表示提取的基于用户评分的情感词共现信息,使用所述基于用户评分的情感词共现信息构建用户评分情感词共现矩阵PMISimsamescore;
将所述全局情感词共现矩阵PMISimglobal、用户评分情感词共现矩阵PMISimsamescore得到融合的情感词共现信息矩阵PMISim。
2.根据权利要求1所述的基于用户评分的情感词典构建方法,其特征在于,所述步骤S2中将所述情感标签进行传播时,具体将每个目标用户标记的评论数据的情感标签传播给其他具有相同或相似评分的评论数据。
3.根据权利要求2所述的基于用户评分的情感词典构建方法,其特征在于,所述步骤S2中,具体通过搜索各互联网平台中目标用户ID的所有评论数据,将搜索到的评论数据按评分数进行划分,划分后评分数相同或相似的评论数据标记为具有情感相似关系。
4.根据权利要求1或2或3所述的基于用户评分的情感词典构建方法,其特征在于,所述步骤S3中进行情感信息提取时,包括基于用户评分提取情感词共现信息步骤,具体步骤包括:
S31.依次获取同一用户中具有相同或相似评分的两条评论数据进行情感词提取,每次提取时从两条评论数据中的其中一条评论数据中抽取出情感词作为一类、另一条评论数据中抽取出情感词作为另一类,将抽取出的两类情感词分别进行一一组合形成共现情感词对,完成所有用户的评论数据的处理后,转入执行步骤S32;
S32.分别对提取出的各所述共现情感词对进行计数,计算数量大于预设阈值的所述共现情感词之间的情感词共现关系量。
5.根据权利要求4所述的基于用户评分的情感词典构建方法,其特征在于,所述步骤S31中进行情感词提取前还包括预处理步骤,具体步骤包括:对于同一用户中具有相同或相似评分的两条评论数据,如果其中包含有转折连词,将该两条评论数据全部删除,如果存在否定词修饰的情感词,删除掉该否定词修饰的情感词,得到预处理后的评论数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910682361.1/1.html,转载请声明来源钻瓜专利网。





