[发明专利]一种基于区间分割的电商水军识别方法有效
| 申请号: | 202110401328.4 | 申请日: | 2021-04-14 |
| 公开(公告)号: | CN113674045B | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 孙宏亮;刘国鑫;丁俊杰;钱子杰;卜湛;曹杰 | 申请(专利权)人: | 南京财经大学 |
| 主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/903;G06F17/11;G06F17/16 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 孙昱 |
| 地址: | 210023 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 区间 分割 商水 识别 方法 | ||
本发明公开一种基于区间分割的电商水军识别方法,步骤是:使用Z‑score对初始数据进行标准化;计算出每个商品正确的评分区间,在该区间内的评分被认为是合理的,反之不合理;计算出各个用户评分的准确率和极差;计算出用户的各个评分到对应商品正确评分区间的距离和,并结合用户评分的准确率和极差,计算出来用户的信誉。最后,选择前N个低信誉用户作为水军。我们在三个数据集(MoiveLens、Netflix和Amazon)上测试了该方法,结果表明该方法在计算用户信誉和识别水军方面表现良好,具有较高的准确性和鲁棒性,且可扩展性强。
技术领域
本发明属于计算机网络内的信息技术领域,包含了对大数据的精密分析,涉及到了在电子商务系统通过用户的评分特征来评估用户信誉的方法,是一种通过分析带权的用户-商品二部图从而得出用户信誉的一种评估及计算方法。
背景技术
随着经济以及网络技术的发展,在网上完成商品交易更加便捷与实惠,这极大地促进了电子商务的发展,而在交易过程中,商品评分是用户选择时一个十分重要的标准,因此我们需要建立可靠的评分系统。在当前的信誉评分系统中存在着许多问题,其中最普遍的即为用户的随意评分或者恶意评分所引发的评分偏差问题,尤其是存在请水军进行大规模的好评或者差评,以此来提高或者降低某个商品的评分的情况,这会严重误导消费者。而水军这个群体数量众多,评分不依据客观事实,同时隐蔽性强,混杂于大量正常用户中,对商品评分造成了不良影响。这对电子商务平台的发展是不利的,严重影响了网上商品交易的正常秩序。因此,构建一个稳定、可靠的用户和商品信誉系统是十分重要的,如果能有一种算法,我们既能剔除恶意用户,又能评估出一个商品的真实质量,这对电子商务的发展乃至整个社会的发展都是极其有利的。
用户-商品信誉系统需要大量用户的评分数据来支撑。我们通过量化用户对商品的影响来反应商品的质量并计算用户的信誉。水军虽然隐蔽性非常强,但通过优质的算法,可以通过水军的评分记录分析出水军与正常用户的区别,以此来筛选出水军。水军群组存在两个非常典型的例子,随机水军群组以及极端水军群组。随机水军群组出于对商品的不够了解等原因,忽略商品质量而随机打分。极端水军群组为了扰乱商品的正常评分,对商品进行最高或最低评分。为了筛选出这两种典型的水军群组,近些年通过大量的实验,许多优质信誉评价算法涌现了出来。
基于相关性的思想:P.LAURETI等人提出了一种迭代的(IR)方法,在这种方法中,用户的信誉与他的评分和相应对象的质量之间的差值成反比,用户信誉和商品质量是迭代计算,直到它们变得稳定。Zhou等人提出了基于相关系数的排名(CorrelationbasedRanking,CR)方法,该方法对恶意用户攻击具有较强的鲁棒性,其中用户的信誉是由他的评分和对象的估计质量之间的相关系数决定的。Liao 等人通过引入信誉再分配过程和两个惩罚因子,进一步改进了CR方法。
基于群组的思想:Gao等人提出了基于群组的排名(Group-based Ranking, GR)方法。后来Gao等人在2015年又在GR的基础上提出了基于群组的迭代排名(Iterative group-based ranking,IGR)的方法,在GR的基础上增加了迭代部分。迭代的运用在后续研究中得到了广泛的运用。Wu等人在消除用户评分偏差 (Eliminating the Effect of RatingBias,IBR)方法中也运用了迭代的思想,将用户评分的偏差与原来的评分对比分为三类,一是消极,二是积极,三是无影响,商品的质量是通过用户的偏差进行修正的。虽然基于偏差的算法在极端用户攻击中取得了卓越效果,但是对于随机用户并没有明显的提升。
基于特定分布假设思想:LEE DAEKYUNG等人提出了基于偏差的随机恶意用户筛选方法(Deviation-based Ranking,DR)。基于Beta分布假设的由 WuYing-Ying等人提出的BR(Bayesian Ranking)算法。以上算法在数据量较大、且比较稀疏的情况下,表现不是很好,鲁棒性欠佳。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110401328.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:对被测设备进行测量的方法
- 下一篇:一种新型的防松螺母系统





