[发明专利]一种评论的真实性检测方法与系统有效
| 申请号: | 201810153301.6 | 申请日: | 2018-02-14 |
| 公开(公告)号: | CN108345587B | 公开(公告)日: | 2020-04-24 |
| 发明(设计)人: | 李树栋;方滨兴;田志宏;吴晓波;殷丽华;李爱平;顾钊铨;韩伟红;仇晶;崔翔;王乐 | 申请(专利权)人: | 广州大学 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/35 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
| 地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 评论 真实性 检测 方法 系统 | ||
本发明公开一种评论的真实性检测方法,包括:对待检测评论进行分词预处理,以得到若干分词结果;将若干分词结果中的词语转化为词向量;通过预先构建的卷积神经网络模型计算待检测评论的情感标签;其中,卷积神经网络模型为通过训练集的每一标准句子的词向量和每一标准句子的情感标签训练卷积神经网络所生成;采用逻辑回归模型从所有待选变量中选取目标特征向量;计算待检测评论的目标特征向量到真实评论的聚类中心的距离,及计算待检测评论的目标特征向量到虚假评论的聚类中心的距离;根据距离和待检测评论的情感标签确定待检测评论的真实性。本发明实施例能够提高评论真实性检测的准确性,同时本发明还提供评论的真实性检测系统。
技术领域
本发明涉及电子商务技术领域,尤其涉及一种评论的真实性检测方法与系统。
背景技术
随着web2.0时代的到来和蓬勃发展,用户在越来越频繁的使用各类电子商务平台进行购物和观点共享。
然而,大多数的电子商务平台存在很大的缺陷。这些平台允许来自全国各地甚至全世界的用户无限制的进行评论,这就促使了一些不法的商家或者制造商雇佣一些刷单员发布一些积极的评论来影响潜在消费者的判断从而增加自己的销售量,或者在竞争者的网店中发布一些消极的评论去影响竞争者的信誉。由于这些虚假评论的结构往往与真实评论非常相似,所以消费者在阅读这些评论的时候很难去识别这些具有危害性的虚假评论。因此,从评论中对虚假评论进行检测是必要的。通常情况下,在电商平台中进行评论的真实性检测时,将其定义为一个二分类的问题,首先通过手工标注的数据集训练分类器,然后将新的评论输入这个分类器去预测为虚假评论或真实评论。由于虚假评论的隐藏性和多样性,因此,手工标注的评论预料中存在着一定数量的错误样例,使用传统的全监督分类算法来识别虚假评论会存在比较大的误差。
现有的评论的真实性检测方法通常是从文本着手,利用自然语言处理技术,分析评论文本的情感极性,判断每个用户的情感偏离大众情感的程度。但由于用户评论噪声大、新词多、有自己固定的搭配、上下文信息有限等原因,用户评论情感的倾向性分析具有很大的难度。
发明内容
本发明实施例提出一种评论的真实性检测方法与系统,能够提高检测虚假评论的准确性。
本发明一方面提供一种评论的真实性检测方法,所述方法包括:
对待检测评论进行分词预处理,以得到所述待检测评论的若干分词结果;
将所述待检测评论的若干分词结果中的词语转化为词向量;
将所述待检测评论的所有词向量输入卷积神经网络模型,以得到所述待检测评论的情感标签;其中,所述卷积神经网络模型为通过训练集的每一标准句子的词向量和预先标记的每一标准句子的情感标签训练卷积神经网络所生成;
采用逻辑回归模型从所有待选变量中选取目标特征向量;
计算所述待检测评论的目标特征向量到预先获得的真实评论的聚类中心的距离,作为第一距离,及计算所述待检测评论的目标特征向量到预先获得的虚假评论的聚类中心的距离,作为第二距离;
根据所述第一距离、所述第二距离和所述待检测评论的情感标签,确定所述待检测评论的真实性。
在一种可选的实施方式中,所述采用逻辑回归模型从所有待选变量中选取目标特征向量,包括:
对评论语料库的每一参考评论,提取所述参考评论的变量;
将所述参考评论的所有变量作为自变量,将所述参考评论的真实性作为因变量,通过逻辑回归模型从所有自变量中选取对所述因变量的影响最显著的自变量,作为所述参考评论的目标特征向量;其中,所述因变量为二值变量;若所述参考评论为真实评论,则所述因变量等于0;若所述参考评论为虚假评论,则所述因变量等于1;
所述真实评论和虚假评论的聚类中心的获取过程,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810153301.6/2.html,转载请声明来源钻瓜专利网。





