[发明专利]基于主题情感语义提取的细粒度观点挖掘方法在审
申请号: | 201611029643.4 | 申请日: | 2016-11-15 |
公开(公告)号: | CN106599063A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 杨正良;李舒燕 | 申请(专利权)人: | 武汉璞华大数据技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 傅海鹏 |
地址: | 430000 湖北省武汉市雄*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主题 情感 语义 提取 细粒度 观点 挖掘 方法 | ||
1.基于主题情感语义提取的细粒度观点挖掘方法,利用基于云模型的主题情感统一最大熵模型进行主题情感语义提取,其特征在于,所述的方法包括以下步骤:
(1)首先,使用基于LDA的最大熵模型进行特征词和观点词提取;
(2)然后,开展情感极性分析,同时对具有不确定性的情感进行定性定量转换建模,在此基础上提出情感修正算法,通过贴近度和云期望曲线实现全局情感和主题情感的相似度计算,进而完成对情感偏差的校正,即将句子的情感划分为五类:负向,弱负向,中立,弱正向,正向,分别对应情感数值为1-5,进而有效提高观点挖掘的精确度;
(3)最后,总结归纳生成情感摘要。
2.根据权利要求1所述的基于主题情感语义提取的细粒度观点挖掘方法,其特征在于,所述的句子的情感的分类是基于词和短语层次。
3.根据权利要求1所述的基于主题情感语义提取的细粒度观点挖掘方法,其特征在于,所述的步骤(1)中,在使用基于LDA的最大熵模型进行特征词和观点词提取之前,还包括语料的预处理,将预处理后的语料输入基于云模型的主题情感统一最大熵模型。
4.根据权利要求3所述的基于主题情感语义提取的细粒度观点挖掘方法,其特征在于,所述的基于云模型的主题情感统一最大熵模型中,对于语料库中的每篇文档,产生文档-主题(D-T)分布,其中D表示文档,T表示主题;对于每个主题产生主题-情感(T-S)分布,对文档中每个句子,通过多项式分布和伯努利分布确定其主题和情感,其中T表示主题,S表示情感。
5.根据权利要求1所述的基于主题情感语义提取的细粒度观点挖掘方法,其特征在于,所述的步骤(2)中,情感修正算法是基于云模型的,若一个主题下观点词的情感分布与全局观点词的情感分布存在明显偏差,则需要进行情感的修正。
6.根据权利要求1所述的基于主题情感语义提取的细粒度观点挖掘方法,其特征在于,作为本发明进一步的方案:所述的步骤(2)中,云期望曲线是通过逆向云发生器得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉璞华大数据技术有限公司,未经武汉璞华大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611029643.4/1.html,转载请声明来源钻瓜专利网。