[发明专利]一种基于依存关系模板抽取观点评价对象的Bootstrapping方法有效
申请号: | 201610537567.1 | 申请日: | 2016-07-08 |
公开(公告)号: | CN106257455B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 杨晓燕;徐戈 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于依存关系模板抽取观点评价对象的Bootstrapping算法,考虑了情感词与观点评价对象词之间的语法、语义关系,构造观点评价对象词与情感词之间的依存关系模板,采用Bootstrapping方法抽取观点评价对象。本发明避免了直接采用词汇上下文抽取评价对象方法所带来的噪音,提高了观点评价对象抽取性能。 | ||
搜索关键词: | 一种 基于 依存 关系 模板 抽取 观点 评价 对象 bootstrapping 算法 | ||
【主权项】:
1.一种基于依存关系模板抽取观点评价对象的Bootstrapping方法,其特征在于:包括以下步骤:步骤S1:以情感词为中心寻找与初始依存关系模板匹配的词,并对该词进行过滤处理,获得候选观点评价对象词;步骤S2:用下式计算候选观点评价对象词j的分数:
将依存关系模板与候选观点评价对象词之间的匹配关系用二维矩阵表示:W=(wij),i={1,2,...,u},j={1,2,...,v},其中,u表示模板个数,v表示候选观点评价对象词候选个数;当第i个依存关系模块与第j个候选观点评价对象词存在匹配关系时,wij=wij+1;步骤S3:按候选观点评价对象词的分数排序,挑选分数最高的5个词进入观点评价对象种子集;步骤S4:从观点评价对象种子集出发寻找观点评价对象词与情感词之间的依存关系,如果存在依存关系则构造候选依存关系模板;步骤S5:用下式计算候选依存关系模板分数:
将一个观点评价对象词与候选依存关系模板的关系用二维矩阵表示:P=(pij),i={1,2,...,m},j={1,2,...,n},其中,m表示观点评价对象个数,n表示候选依存关系模板个数;当第i个观点评价对象词与第j个候选依存关系模板存在匹配关系时,pij=pij+1;步骤S6:按候选依存关系模板的分数排序,挑选分数大于阈值θ的依存关系模板进入模板集;步骤S7:重复步骤S1至步骤S6,直至没有新的候选观点评价对象词产生;步骤S8:利用依存分析和语义角色标注技术的规则,对得到的候选观点评价对象进行边界识别;其中,步骤S8中,所述依存分析和语义角色标注技术的规则具体包括:合并规则:如果当前词是观点评价对象词,该词的前一个词或后一个词出现在候选观点评价对象集中,则前一个词或后一个词扩展为观点评价对象词;ATT规则:如果当前词是观点评价对象,前一个词或后一个词与该词具有ATT或QUN或DE句法依存关系,则前一个词或后一个词扩展为观点评价对象词;LAD规则:如果当前词与当前词的父亲词依存关系是LAD且前一个词是观点评价对象词,则当前词的父亲词是观点评价对象词;COO规则:如果当前词与当前词的儿子词依存关系是COO,且当前词是观点评价对象词,则当前词的儿子词是观点评价对象词;SRL规则:如果当前词与某些词的语义关系是施事关系同时又与另外一些词的语义关系存在受事关系且受事者中包含情感词则施事者是观点评价对象词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610537567.1/,转载请声明来源钻瓜专利网。