[发明专利]基于密集块检测的刷单检测引擎装置在审
申请号: | 201810767589.6 | 申请日: | 2018-07-13 |
公开(公告)号: | CN109064189A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 林飞;王娜;熊骁;潘练;古元;毛华阳 | 申请(专利权)人: | 北京亚鸿世纪科技发展有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100082 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于密集块检测的刷单检测引擎涉及信息技术领域,本发明由维度定义器,行为定义器,数据连接器,密集块检测器组成;其中密集块检测器由局部搜索器和调节模式算法组成;本发明的基于密集块检测的刷单检测引擎装置采用基于一种新的评价指标来发现在不确定图上的稠密子图,通过随机选取一个块,然后使用一种近似于贪心的方法不断调整这个块的维度,直到其达到局部最优。本发明的方法由于是在多维度对稠密子图进行比较挖掘,因此能够更加准确的找到在多个评价指标下即多个维度下都具有稠密子图特征的集合,因此能够准确而有效的确定虚假销售群体,恶意刷单的群体,具有高准确性,广泛适用性的特征。本发明可以广泛的应用于网络入侵检测、虚假微博转发量检测、僵尸粉分析以及遗传学相关研究。 | ||
搜索关键词: | 块检测 维度 稠密 检测器 评价指标 引擎装置 检测 网络入侵检测 信息技术领域 数据连接器 局部搜索 模式算法 随机选取 行为定义 定义器 多维度 量检测 遗传学 微博 群体 引擎 近似 集合 转发 挖掘 应用 销售 分析 发现 研究 | ||
【主权项】:
1.基于密集块检测的刷单检测引擎,其特征在于由维度定义器,行为定义器,数据连接器,密集块检测器组成;其中密集块检测器由局部搜索器和调节模式算法组成;维度定义器负责定义做密集块判定时的N维空间,在刷单检测时维度的类型包括但不限于:网店地址,博客地址,旅店评价地址,饭店评价地址;当对网店地址类型做刷单判定时,维度N指既定范围内的N家网店,既定范围指同一体系下,同一体系指管理范围,诸如天猫,京东,阿里巴巴属于不同的管理范围;行为定义器负责定义密集行为的类型,在刷单检测时密集行为的类型包括但不限于:重复评价,同样评价,僵尸粉大量关注;数据连接器负责为密集块检测器中的算法中的变量对应相应的数据类型,每个用户都可以表示成N维的数据点,子空间就是用两个奇异值组成的,是N维度的点在空间中的可视化;利用
可以表示为特征子空间的点集形成,其中
表示的是第n个用户在第i的左奇异向量中的值,右特征子空间类似,可表示成
,通过这些空间中的散点图就能解释用户内在直接连接的特殊关系;
表示维度j拥有Nj个可能取值;
定义为可疑块中维度j可以取的可能值的合集,其中每个维度j上的可能取值都是相应维度上总数据集可能取值的子集;
代表可疑块可能取值的质量;
表示可疑块在数据块中的计算函数,其中f为评价函数;密集块检测器的局部搜索器负责从一个种子块开始,在K个维度中的每个维度j中计算最可能取值,迭代计算直到取得可疑块的最可能取值,输出可疑块;种子块支持随机选取的模式和指定选取的模式;局部搜索器的算法表示如下:Require:Data X,seed region Ywith
while not converged do for j=1...K do
ADJUSTMODE(j)end forend whilereturn
;ADJUSTMODE是密集块检测器的调节模式算法,调节模式算法每次需要计算的是维度j,所以在迭代时候需要固定其他维度除j维度以外维度取值不变;其中
指的是在维度j中取值
带来的质量变化;算法的复杂度为O(T×K×(E+NlogN)),其中T是迭代次数,K是维度的个数,E是数据集中非0的项的个数;调节模式算法的函数表达式ADJUSTMODE如下所示:![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亚鸿世纪科技发展有限公司,未经北京亚鸿世纪科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810767589.6/,转载请声明来源钻瓜专利网。
- 上一篇:基于标识的防伪系统及其防伪方法
- 下一篇:一种学籍信息存储系统