[发明专利]一种评论标签生成方法、装置和计算设备有效
申请号: | 202010059910.2 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111241290B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 寇凯;息振兴;史立华;王田利;付一韬;杨林凤;谢健聪 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/242;G06F40/289;G06F40/30 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 史小娟;谢建云 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 标签 生成 方法 装置 计算 设备 | ||
本发明公开了一种评论标签生成方法,在计算设备中执行,该计算设备中存储有规则集,该规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,该方法包括步骤:提取从目标评论中切分出的多个单维度子句,该单维度子句是维度词和情感词均只有一个的子句;基于标准词词典将各单维度子句的维度词和情感词分别替换为对应的标准词;对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,构成目标评论的评论标签。本发明还一并公开了对应的评论标签生成装置和计算设备。
技术领域
本发明涉及计算机技术领域,尤其涉及一种评论标签生成方法、装置和计算设备。
背景技术
随着信息工业的快速发展,越来越多的用户在各种互联网平台上购买产品和发表评论,且用户在购买产品前更希望能知道已使用过该产品的人群对于该产品的评价。不同于整体的情感分析,基于维度情感分析的分析粒度更为精细,其主要目的是根据评论信息给出一系列简明的表达,说明用户群体对某一产品各个维度的喜好程度。细粒度情感分析对于深刻理解商家和用户、挖掘用户情感等方面有至关重要的价值,能够广泛应用在个性化推荐、智能搜索、产品反馈、业务安全等领域。
目前有基于长短期记忆网络的方法,将问题整体看作多维度的情感多分类问题,若有N种类别,每个类别的情感是二分类,则统一训练模型的类别为2N种。这种情况下要求各类别间必须具有明显区分的属性,比如汽车领域的动力、油耗等。但如果精确到更细维度,例如空间里的前排空间、后排空间、头部空间、腿部空间等,维度信息非常接近,且训练对象都是短句,上下文信息少,导致在整体分类过程中很难判断正确,正确率也非常低。
另外一种方式是提取句子的中文情感词来表达整条评论的情感倾向,但评论文章的词语用法多种多样,很有可能导致抽取情感词对句子判定结果和实际结果的发生偏差,从而导致细粒度情感分析错误。
发明内容
鉴于上述问题,本发明提出了一种评论标签生成方法、装置和计算设备,以力图解决或者至少解决上面存在的问题。
根据本发明的一个方面,提供了一种评论标签生成方法,在计算设备中执行,该计算设备中存储有规则集,该规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,该方法包括步骤:提取从目标评论中切分出的多个单维度子句,所述单维度子句是维度词和情感词均只有一个的子句;基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词;对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到所述目标评论的评论标签。
可选地,在根据本发明的评论标签生成方法中,还包括步骤:采用情感分析模型对每个目标单维度子句进行情感分析,得到该目标单维度子句的情感极性,所述情感极性包括正向情感、负向情感和中性情感中的至少一种。
可选地,在根据本发明的评论标签生成方法中,提取从目标评论中切分出的多个单维度子句的步骤包括:将该目标评论切分为多个短句,并对该多个短句进行分词处理,以识别其中同时具有维度词和情感词的目标短句;以及当目标短句超过预定字数或者存在两个以上情感词时,基于预先训练好的分句模型将该目标短句切分为多个单维度子句。
可选地,在根据本发明的评论标签生成方法中,将该目标评论切分为多个短句的步骤包括:根据目标评论的标点符号将该目标评论切分为多个短句;其中,若目标评论没有标点符号,则基于所述分句模型将该目标评论切分为多个单维度子句。
可选地,在根据本发明的评论标签生成方法中,将该目标评论切分为多个短句的步骤包括:剔除具有特殊句式的目标评论,再将剩下的目标评论切分为多个短句,该特殊句式包括反问句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010059910.2/2.html,转载请声明来源钻瓜专利网。