[发明专利]一种基于购物行为序列数据的虚假评论检测系统和方法有效
| 申请号: | 201910097065.5 | 申请日: | 2019-01-31 |
| 公开(公告)号: | CN109829733B | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 古平;邵思宇;周蒙;张程;李佳;刘希萌;杨瑞龙 | 申请(专利权)人: | 重庆大学 |
| 主分类号: | G06Q30/018 | 分类号: | G06Q30/018;G06Q30/0217 |
| 代理公司: | 重庆市前沿专利事务所(普通合伙) 50211 | 代理人: | 郭云 |
| 地址: | 400044 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 购物 行为 序列 数据 虚假 评论 检测 系统 方法 | ||
本发明公开一种基于购物行为序列数据的虚假评论检测系统和方法,包括以下步骤:S1:获取用户购物行为序列数据,标记为序列Z;S2:从Z中获取训练或待检商品的购物行为序列数据,并进行预处理得到序列H;S3:利用序列H中的数据进行概率后缀树模型的建模,以便于分析;S4:对商品进行筛选得到可疑商品集合U;S5:对可疑商品集合U中每件商品的评论进行分析,获得商品的可疑评论集合W;S6:利用概率后缀树模型分析检测虚假评论者;S7:搜索虚假评论者评价的商品,并对可疑商品集合U进行更新。本发明通过感知用户的购物行为,构建一种有别于评论文本的概率后缀树模型,用于检测虚假评论者。
技术领域
本发明涉及电子商务领域,特别涉及一种基于购物行为序列数据的虚假评论检测系统和方法。
背景技术
随着电子商务网站及点评网站的发展,越来越多的网络用户通过发布评论分享消费体验、评价产品的质量,并在做出消费决策时参考其他用户的评论,评论信息日益影响着人们的生活。人们对评论信息的依赖催化了虚假评论的不断涌现。因此需对评论信息进行检测,识别评论信息的真假。现有技术主要是采用虚假评论文本检测和虚假评论者检测。
虚假评论文本检测研究包含三类检测方法:1)语法分析,包括对文本进行词袋特征分析及词性特征分析,研究者基于语法分析获得的特征,运用分类模型如支持向量机及神经网络模型均获得了较好的检测效果。2)语义分析,运用特征分析方法或语义表示方法对文本的在语义层面的信息进行特征提取或抽象表示,应用语义分析的虚假评论文本检测方法有稀疏相加生成模型、神经网络模型及语义语言模型等。3)对评论进行文体及元数据分析,有助于挖掘评论的语言风格及评论者的撰写习惯,提取此类特征能够从文本内容以外的角度分析评论及相应的评论者,一些检测方法在有标注数据集上,运用经典分类模型如支持向量机、朴素贝叶斯等预测虚假评论文本。
虚假评论者检测通过挖掘评论者特征,分析评论者的反常行为对虚假评论者进行预测。如通过时序分析检测虚假评论者,研究者运用马尔可夫随机场(MRF)模型基于评论者之间的关系构建评论者网络,将评论者作为观察结点,每个评论者的真实类别为隐含结点,对一个爆发期内共同出现的评论者用边相连接、建立关联关系。
也有研究者同时利用评论者、评论文本之间的网络拓扑结构进行虚假评论者检测。该类方法首先对评论者、评论文本,包括评论对象构建关系网络,再通过基于图的方法对虚假评论者进行度量和分析。该类方法包括基于HITS算法的检测模型和基于马尔可夫随机场的检测模型。此外,也有研究者利用评论和评论者的特征提出一种双视图、联合训练的半监督学习方法。
但现有技术中存在很多方面的不足:
(1)需要同时利用正类和负类样本进行模型训练。电商评论分布较广、数量级巨大,人工数据标注困难,如何在只有单类样本的情况下进行虚假评论检测是个急需解决的问题。
(2)在不同应用领域中可迁移性较差。在某个领域中训练得到的虚假评论检测模型,由于评论对象、风格、情感词等差异,往往很难迁移到其它领域中。
(3)分类特征容易被虚假评论者伪造,导致查全率不高。现有研究多利用评论文本特征、评分特征或社会特征等进行建模、检测,而上述特征形式均存在易于伪造的问题。如虚假评论者虚构出大量的好评或使用体验,在缺乏其它客观证据的情况下,检测系统很难判定该评论的真实程度。
发明内容
针对现有技术的问题,本发明提供一种基于购物行为序列数据的虚假评论检测系统和方法,通过研究真实(或虚假)评论用户的购物行为序列的概率特征,最终识别出虚假评论者、虚假评论以及评论商品。
为了实现上述目的,本发明提供以下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910097065.5/2.html,转载请声明来源钻瓜专利网。





