[发明专利]一种基于区间分割的电商水军识别方法有效

专利信息
申请号: 202110401328.4 申请日: 2021-04-14
公开(公告)号: CN113674045B 公开(公告)日: 2022-08-26
发明(设计)人: 孙宏亮;刘国鑫;丁俊杰;钱子杰;卜湛;曹杰 申请(专利权)人: 南京财经大学
主分类号: G06Q30/06 分类号: G06Q30/06;G06F16/903;G06F17/11;G06F17/16
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 孙昱
地址: 210023 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 区间 分割 商水 识别 方法
【权利要求书】:

1.一种基于区间分割的电商水军识别方法,其特征在于包括如下步骤:

步骤1,定义三元组数据结构G={i,α,r},分别表示用户、商品和评分;

步骤2,假设用户的评分服从正态分布,计算商品历史评分的均值和方差;

步骤3,分别计算用户评分的正确率,用户各个评分到对应评分区间的距离之和,以及用户评分的极差;

所述步骤3中,计算用户评分的正确率的方法是:

步骤A31,利用Z-score方法对用户评分进行标准化处理;

步骤A32,将标准化处理后的评分进行归类,确定评分区间,在评分区间内的评分认为是正确的评分,否则认为是非正确评分;

步骤A33,统计用户正确评分的次数和非正确评分的次数,从而计算用户评分的正确率;

步骤4,根据用户评分的正确率和极差,结合用户各个评分到对应评分区间的距离之和,得到用户信誉;

所述步骤4中,计算用户信誉公式是:

其中,Ri表示用户i的信誉,di表示用户i各个评分到对应评分区间的距离之和,ηi表示用户i评分的正确率,vi表示用户i评分的极差;

步骤5,将用户信誉进行排序,选择信誉最低的前N个用户作为水军,N为设定值;

所述步骤A33的具体内容是:统计用户正确评分的次数si和非正确评分的次数fi,然后利用下式计算用户评分的正确率:

其中,ηi表示用户i评分的正确率;

所述步骤3中,计算用户各个评分到对应评分区间的距离之和的公式是:

其中,bd表示根据步骤A32确定的评分区间的边界,即-1或者1,当r'≤-1,bd=-1,当r'≥1,bd=1,否则r'=bd;di表示用户i各个评分到对应评分区间的距离之和,Oi为对商品α评分的用户i的集合;fi表示用户i非正确评分的次数;

所述步骤3中,计算用户评分的极差的公式是:

其中,vi表示用户i评分的极差,tir表示用户i在各个评分r下的打分次数。

2.如权利要求1所述的基于区间分割的电商水军识别方法,其特征在于:所述步骤2中,根据下式计算商品α的历史评分的均值μα

其中,Uα表示购买商品α的用户集合,|Uα|表示购买商品α的用户数,r表示用户i对商品α的评分;

根据下式计算商品α的历史评分的方差σα

其中,Uα表示购买商品α的用户集合,|Uα|表示购买商品α的用户数,r表示用户i对商品α的评分,μα表示商品α的历史评分的均值。

3.如权利要求1所述的基于区间分割的电商水军识别方法,其特征在于:所述步骤A31的具体内容是:

根据下式计算标准化后商品α的评分:

其中,r表示用户i对商品α的评分,μα表示商品α的历史评分的均值,σα表示商品α的历史评分的方差。

4.如权利要求1所述的基于区间分割的电商水军识别方法,其特征在于:所述步骤5中,采用冒泡排序法将用户信誉从小到大进行排序;对于信誉相同的用户,根据其用户编号,将编号大的放在编号小的前面。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110401328.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top