[发明专利]用于构建极性词素数据库以及确定词的极性的方法和装置无效
| 申请号: | 201010257635.1 | 申请日: | 2010-08-17 |
| 公开(公告)号: | CN102375838A | 公开(公告)日: | 2012-03-14 |
| 发明(设计)人: | 张洁;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 潘士霖;李春晖 |
| 地址: | 日本神*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 构建 极性 词素 数据库 以及 确定 方法 装置 | ||
技术领域
本发明一般地涉及文字处理。更具体地,本发明涉及词的极性的判断。
背景技术
词的极性(polarity)的确定广泛应用于文章分类、观点挖掘和情感分析等。在传统的方法中,为了提高词的极性识别的性能,构造包括大量的具有手工标注词性的词的词典。构造这样的词典费时且成本高。
发明内容
根据本发明的第一方面,提供了一种用于构建极性词素数据库的方法,包括:从语料库和/或词语库中提取具有极性的单音节词;以及对具有极性的单音节词标注极性,被标注极性的单音节词构成极性词素数据库。
根据本发明的第二方面,提供了一种用于确定词的极性的方法,包括:
对于要确定极性的词,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息;根据所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,并根据所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及对词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定词的极性。
根据本发明的第三方面,提供了一种用于构建极性词素数据库的装置,包括:提取单元,被配置用于从语料库和/或词语库中提取具有极性的单音节词;以及标注单元,被配置用于对具有极性的单音节词标注极性,被标注极性的单音节词构成极性词素数据库。
根据本发明的第四方面,提供了一种用于确定词的极性的装置,包括:互信息计算单元,被配置用于对于要确定极性的词,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息;关联性计算单元,被配置用于根据互信息计算单元所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,并根据互信息计算单元所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及判定单元,被配置用于对关联性计算单元所计算的词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定词的极性。
依据本发明的其它实施例,还提供了相应的计算机可读存储介质和计算机程序产品。
根据本发明的实施例,可以有效地构建极性词素数据库以及确定词的极性。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其它的优点将更加明显。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:
图1示出了根据本发明的一个实施例的构建极性词素数据库的方法的流程图;
图2示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图;
图3示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图;
图4示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图;
图5示出了根据本发明的一个实施例的用于确定词的极性的方法的流程图;
图6示出了根据本发明的另一个实施例的用于确定词的极性的方法的流程图;
图7示出了根据本发明的一个实施例的用于构建极性词素数据库的装置的框图;
图8示出了根据本发明的另一个实施例的用于构建极性词素数据库的装置的框图;
图9示出了根据本发明的一个实施例的用于确定词的极性的装置的框图;
图10示出了根据本发明的另一个实施例的用于确定词的极性的装置的框图;以及
图11示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010257635.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车轮胎防盗螺栓
- 下一篇:带位移传感器的AGC油缸





