[发明专利]一种融合复杂关系的虚假评论者群体检测方法在审
申请号: | 202210449853.8 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114742564A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 于硕;李世豪;雷启航;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06K9/62 |
代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 许明章;王海波 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 复杂 关系 虚假 评论 群体 检测 方法 | ||
本发明属于人工智能领域,提出一种融合复杂关系的虚假评论者群体检测方法,用于在线交易平台上的虚假评论群体检测。本方法包括节点表征更新、模型训练和虚假评论群体检测三个阶段。本方法将训练好的模型应用在真实数据集下,既能识别出虚假评论者,也可以很好地将虚假评论者群体与正常评论者区分。本方法基于节点的复杂关系特征,充分利用评论者间有价值的关系信息,将嵌入过程与聚类检测过程整合,获得一种以目标为导向的虚假评论者群体检测模型,同时可以克服现有群体检测方法存在的普适性差、检测效果低下等问题。
技术领域
本发明涉及人工智能领域,特别涉及一种融合复杂关系的虚假评论者群体检测方法。
背景技术
在线评论系统的迅速流行使得评论成为人们购买商品的重要依据,越来越多的人在购买商品前会在平台上查看评论,也会在购买商品后做出对商品的评价。这些评论可以给顾客提供有用的信息和第一手商品体验,因此在线评论的质量尤为重要,虚假的、不符合商品事实的评论会影响商品的声誉,同时也会混淆买家视线。
现有虚假评论检测技术大多数通过大数据与人工智能的方法来实现,传统的检测技术利用手工生成的特征来对评论者进行分类,基于行为特征、利用评论中的语言特征以及构建图来捕捉用户之间的关系特征。以往研究人员主要将注意力集中在检测单独的虚假评论者,然而虚假评论群体往往会对在线评论系统造成更大危害,发现群体虚假评论者存在难度:群体中的虚假评论可能是正常的单独评论,以往的单独虚假评论检测技术很难发挥作用。另外,虚假评论者之间难以建立关系,而这种复杂关系能够使得模型抓取群体内评论者之间的联系,从而辅助虚假评论者群体检测。
当前虚假评论群体检测方法可归为如下几类:
基于聚类算法的检测方法。基于聚类算法的检测算法通常使用图神经网络等算法学习节点嵌入表示,然后通过聚类算法对节点进行聚类,最终通过检测方法来检测虚假评论群体。常见的聚类算法如基于分区的聚类算法KMeans、基于密度的聚类算法DBSCAN。
(1)KMeans聚类算法主要是将样本空间中的所有点划分为K组,相似度通常使用欧几里得距离来进行衡量,其算法的主要流程如下:随机放置K个质心,每个簇中存在一个质心。计算每个点到质心的距离,每个数据点都分配到其最近的质心,形成一个集群。在迭代过程中,重新计算质心K的位置。
(2)DBSCAN聚类算法首先确定每个点的类型,数据集中的每个数据点都有可能是核心点或者边界点。如果一个数据点的邻域内至少有M个点在指定的半径R内,则该数据点是核心点,如果一个数据点邻域内少于M个数据点,或者其可以从某个核心点到达,即其在距离核心点的R距离内,则说明其是边界点。作为邻居的核心点将被连接并放在同一个集群中,边界点将被分配给每一个集群。
基于图的检测方法。从子图入手,使用节点或者子图的属性来对群体的可疑性进行判断,从而实现整个检测过程。一些方法从图拓扑结构,时间和评分的差别中聚合关系,使用联合概率来检测虚假评论者群体。此种方法忽略了节点自身的结构特征,没有考虑节点之间的复杂关系。还有一些方法提出群体的几个主要特征,如同步性、适度性和分散性,并通过计算某些指标来检测群体异常。此种方法在实际应用中缺少普适性,对于不同的网络或是数据集,需要提出特定的指标才能较好地完成虚假评论群体检测任务,若将其推广,检测精度会大幅下降。此外,此种方法仅仅考虑了群体内部的特征,仍然缺少对于评论者之间复杂关系的考虑。
发明内容
现有的虚假评论群体检测方法中,嵌入过程和后续的聚类与检测过程是分开的,训练过程缺乏目标指引,如果表示学习的结果并不适合检测,所得到的虚假评论群体检测结果将会很差。此外,评论网络中的复杂关系被忽略,群体内评论者间有价值的关系信息无法得到利用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210449853.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种激光芯片测试分选机及其工作方法
- 下一篇:一种沙化土地综合治理方法