[发明专利]文本情感倾向性分析方法有效
申请号: | 200910083522.1 | 申请日: | 2009-05-08 |
公开(公告)号: | CN101882136A | 公开(公告)日: | 2010-11-10 |
发明(设计)人: | 吴琼;谭松波;程学旗 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 倾向性 分析 方法 | ||
1.一种文本情感倾向性分析方法,包括下列步骤:
1)根据训练文本的标签确定测试文本的初始情感分;
2)基于图排序算法利用所述测试文本的初始情感分迭代计算所述测试文本的情感分并进行归一化;
3)当所述迭代结束时,根据所述计算的结果判别所述测试文本的情感倾向性。
2.根据权利要求1所述的方法,其特征在于,所述步骤2)进一步包括:
以所述测试文本为结点、所有测试文本间的内容相似度为边建立图模型;
根据所述图模型构建联接矩阵并归一化;
将所述归一化的联接矩阵的每一行降序排列;
根据所述降序排列后的联接矩阵的每一行的前K2个元素对应的测试文本的情感分计算所述测试文本的情感分,其中K2的取值范围为[1,测试文本个数]。
3.根据权利要求1所述的方法,其特征在于,
所述步骤1)还包括根据训练文本的标签确定训练文本的初始情感分;
所述步骤2)进一步包括:
21)基于所述图排序算法,利用所述训练文本的初始情感分计算所述测试文本的情感分的第一分量;
22)基于所述图排序算法,利用所述测试文本的初始情感分计算所述测试文本的情感分的第二分量;
23)利用所述两个分量迭代计算所述测试文本的情感分并归一化。
4.根据权利要求3所述的方法,其特征在于,所述步骤21)进一步包括:
以所述测试文本和训练文本为结点、所述训练文本和所述测试文本间的内容相似度为边建立图模型;
根据所述图模型构建联接矩阵并归一化;
将所述归一化的联接矩阵的每一行降序排列;
根据所述降序排列后的联接矩阵的每一行的前K1个元素对应的训练文本的情感分计算所述测试文本的情感分的第一分量,其中K1的取值范围为[1,训练文本个数]。
5.根据权利要求3所述的方法,其特征在于,所述步骤22)进一步包括
以所述测试文本为结点、所有测试文本间的内容相似度为边建立图模型;
根据所述图模型构建联接矩阵并归一化;
将所述归一化的联接矩阵的每一行降序排列;
根据所述降序排列后的联接矩阵的每一行的前K2个元素对应的测试文本的情感分计算所述测试文本的情感分的第二分量,其中K2的取值范围为[1,测试文本个数]。
6.根据权利要求1至3任一项所述的方法,其特征在于,所述步骤1)包括:根据所述训练文本的标签对所述测试文本进行分类,根据所述分类确定所述测试文本的初始情感分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910083522.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:极细同轴线的末端处理方法及末端处理构造
- 下一篇:一种新型钻机底座的下层结构