[发明专利]评价数据的分析方法、装置及系统有效
申请号: | 201610670873.2 | 申请日: | 2016-08-15 |
公开(公告)号: | CN107766316B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 姜珊珊;郑继川;董滨 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F40/216 | 分类号: | G06F40/216 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;张博 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评价 数据 分析 方法 装置 系统 | ||
本发明提供了一种评价数据的分析方法、装置及系统,属于自然语言处理领域。其中,评价数据的分析方法包括:获取用户的评价数据,所述评价数据包括有产品的评价要素及用户对所述评价要素的第一评价分值;对所述评价要素进行聚类;利用所述第一评价分值对每一聚类的评价要素进行参数估计,得到每一评价要素聚类的第二评价分值,所述第二评价分值为根据每一聚类的评价要素的第一评价分值和用户的评分权重得到的加权平均值。通过本发明的技术方案能够获得更接近用户对产品或者产品某一特征的真实想法的评价。
技术领域
本发明涉及自然语言处理领域,特别是指一种评价数据的分析方法、装置及系统。
背景技术
目前用户对产品的评价通常是通过文本来进行表达,为了更好地理解和分析评价文本中的观点,评价要素的观点挖掘成为评价分析领域的主要课题。评价要素的观点挖掘主要包含两个步骤,评价要素的抽取和其对应的情感倾向性的判别。
评价要素可以是被评价产品的某一特征,例如,在手机产品领域,“电池”和“屏幕”可以是评价要素。用户对评价要素的情感倾向性通常可以以评价分值来表示,比如+N通常代表正面评价,0代表中性评价,-N代表负面评价,其中,N为正整数。在分析用户对产品或者产品某一特征的观点时,综合分析多个用户的评价分值显然比分析单一用户的评价分值更有意义。因此,现有技术一般是获得多个用户对同一评价要素的评价分值,再将其平均值作为该评价要素的真实评价分值。
但是,用户对评价要素的评价分值往往具有一定的偏置性。比如对于同一款手机产品,用户A比较在意手机屏幕,对于手机电池的续航能力不太在意,则用户A对该手机产品进行评价时,对手机屏幕的打分比较苛刻为-4分,对手机电池的打分比较宽容为+5分;而用户B相反,比较在意手机电池的续航能力,而对于手机屏幕不太在意,则用户B对该手机产品进行评价时,对手机电池的打分比较苛刻为-3分,对手机屏幕的打分比较宽容为+4分。显然,简单地对多个用户对同一评价要素的评价分值进行计算获得的算数平均值不能代表用户对产品或产品某一特征的真实评价。
发明内容
本发明要解决的技术问题是提供一种评价数据的分析方法、装置及系统,能够获得更接近用户对产品或者产品某一特征的真实想法的评价。
为解决上述技术问题,本发明的实施例提供技术方案如下:
一方面,提供一种评价数据的分析方法,包括:
获取用户的评价数据,所述评价数据包括有产品的评价要素及用户对所述评价要素的第一评价分值;
对所述评价要素进行聚类;
利用所述第一评价分值对每一聚类的评价要素进行参数估计,得到每一评价要素聚类的第二评价分值,所述第二评价分值为根据每一聚类的评价要素的第一评价分值和用户的评分权重得到的加权平均值。
进一步地,所述获取用户的评价数据具体包括:
抓取用户的评价文本;
对所述评价文本进行识别,抽取出所述评价文本所包含的产品的评价要素及用户对所述评价要素的第一评价分值,根据产品的评价要素及用户对所述评价要素的第一评价分值以生成所述评价数据。
进一步地,所述对所述评价要素进行聚类,利用所述第一评价分值对每一聚类的评价要素进行参数估计,得到每一评价要素聚类的第二评价分值包括:
将获取的评价数据划分为多个集合,每一集合中的评价要素属于同一产品的同一聚类;
在每一集合中,建立以对应评价要素聚类的第二评价分值和用户的评分权重为参数的最大似然估计方程;
迭代第二评价分值估计值和用户的评分权重估计值使所述最大似然估计方程的目标值最大化至收敛,将得到的第二评价分值估计值作为所在集合对应评价要素聚类的第二评价分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610670873.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置