[发明专利]一种基于区间分割的电商水军识别方法有效
| 申请号: | 202110401328.4 | 申请日: | 2021-04-14 |
| 公开(公告)号: | CN113674045B | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 孙宏亮;刘国鑫;丁俊杰;钱子杰;卜湛;曹杰 | 申请(专利权)人: | 南京财经大学 |
| 主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/903;G06F17/11;G06F17/16 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 孙昱 |
| 地址: | 210023 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 区间 分割 商水 识别 方法 | ||
1.一种基于区间分割的电商水军识别方法,其特征在于包括如下步骤:
步骤1,定义三元组数据结构G={i,α,r},分别表示用户、商品和评分;
步骤2,假设用户的评分服从正态分布,计算商品历史评分的均值和方差;
步骤3,分别计算用户评分的正确率,用户各个评分到对应评分区间的距离之和,以及用户评分的极差;
所述步骤3中,计算用户评分的正确率的方法是:
步骤A31,利用Z-score方法对用户评分进行标准化处理;
步骤A32,将标准化处理后的评分进行归类,确定评分区间,在评分区间内的评分认为是正确的评分,否则认为是非正确评分;
步骤A33,统计用户正确评分的次数和非正确评分的次数,从而计算用户评分的正确率;
步骤4,根据用户评分的正确率和极差,结合用户各个评分到对应评分区间的距离之和,得到用户信誉;
所述步骤4中,计算用户信誉公式是:
其中,Ri表示用户i的信誉,di表示用户i各个评分到对应评分区间的距离之和,ηi表示用户i评分的正确率,vi表示用户i评分的极差;
步骤5,将用户信誉进行排序,选择信誉最低的前N个用户作为水军,N为设定值;
所述步骤A33的具体内容是:统计用户正确评分的次数si和非正确评分的次数fi,然后利用下式计算用户评分的正确率:
其中,ηi表示用户i评分的正确率;
所述步骤3中,计算用户各个评分到对应评分区间的距离之和的公式是:
其中,bd表示根据步骤A32确定的评分区间的边界,即-1或者1,当r'iα≤-1,bd=-1,当r'iα≥1,bd=1,否则r'iα=bd;di表示用户i各个评分到对应评分区间的距离之和,Oi为对商品α评分的用户i的集合;fi表示用户i非正确评分的次数;
所述步骤3中,计算用户评分的极差的公式是:
其中,vi表示用户i评分的极差,tir表示用户i在各个评分r下的打分次数。
2.如权利要求1所述的基于区间分割的电商水军识别方法,其特征在于:所述步骤2中,根据下式计算商品α的历史评分的均值μα:
其中,Uα表示购买商品α的用户集合,|Uα|表示购买商品α的用户数,riα表示用户i对商品α的评分;
根据下式计算商品α的历史评分的方差σα:
其中,Uα表示购买商品α的用户集合,|Uα|表示购买商品α的用户数,riα表示用户i对商品α的评分,μα表示商品α的历史评分的均值。
3.如权利要求1所述的基于区间分割的电商水军识别方法,其特征在于:所述步骤A31的具体内容是:
根据下式计算标准化后商品α的评分:
其中,riα表示用户i对商品α的评分,μα表示商品α的历史评分的均值,σα表示商品α的历史评分的方差。
4.如权利要求1所述的基于区间分割的电商水军识别方法,其特征在于:所述步骤5中,采用冒泡排序法将用户信誉从小到大进行排序;对于信誉相同的用户,根据其用户编号,将编号大的放在编号小的前面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110401328.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:对被测设备进行测量的方法
- 下一篇:一种新型的防松螺母系统





