[发明专利]基于密集块检测的刷单检测引擎装置在审
申请号: | 201810767589.6 | 申请日: | 2018-07-13 |
公开(公告)号: | CN109064189A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 林飞;王娜;熊骁;潘练;古元;毛华阳 | 申请(专利权)人: | 北京亚鸿世纪科技发展有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100082 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 块检测 维度 稠密 检测器 评价指标 引擎装置 检测 网络入侵检测 信息技术领域 数据连接器 局部搜索 模式算法 随机选取 行为定义 定义器 多维度 量检测 遗传学 微博 群体 引擎 近似 集合 转发 挖掘 应用 销售 分析 发现 研究 | ||
基于密集块检测的刷单检测引擎涉及信息技术领域,本发明由维度定义器,行为定义器,数据连接器,密集块检测器组成;其中密集块检测器由局部搜索器和调节模式算法组成;本发明的基于密集块检测的刷单检测引擎装置采用基于一种新的评价指标来发现在不确定图上的稠密子图,通过随机选取一个块,然后使用一种近似于贪心的方法不断调整这个块的维度,直到其达到局部最优。本发明的方法由于是在多维度对稠密子图进行比较挖掘,因此能够更加准确的找到在多个评价指标下即多个维度下都具有稠密子图特征的集合,因此能够准确而有效的确定虚假销售群体,恶意刷单的群体,具有高准确性,广泛适用性的特征。本发明可以广泛的应用于网络入侵检测、虚假微博转发量检测、僵尸粉分析以及遗传学相关研究。
技术领域
本发明涉及信息技术领域,尤其是信息技术中的基于大数据的行为分析领域。
背景技术
随着电子商务行业的迅猛发展,网络购物逐渐成为一种新的生活方式,电商行业的竞争也愈演愈烈,在利益的驱动下,电商行为逐渐成为了电商平台的“潜规则”,由于电商业务正在发展之中,各种约束规范都不完善,所以电商平台的刷单行为比较严重。
针对刷单行为,京东的反刷单系统从订单、商品、用户、物流等多个维度进行统计,分别计算每个维度下的不同特征值,能够较精准识别刷单相关的恶意行为。
淘宝后台检测刷单的稽查系统,主要包括机审和人工审核两个方面,对于其中机审难以判断的订单进入人工排查得到最终结果,店家可申诉,申诉后即可进入人工判定阶段,通过查看商品评价的内容、买家信息进行判断。
现有技术中的检测方法刷单检测仅限于电商平台内部的自我督查机制,需要大量的内部交易原始数据进行特征分析或者需要专门的数据接收和分析配备,仍无法清晰准确地分析出是否存在刷单行为。
现有的技术通常依赖复杂的数据模型对刷单行为进行分析,通过获取多个商品的原始数据,需要计算大量的特征率值包括静默转化率、订单咨询率、流量转化率、成交转化率、订单支付率、收藏率、收货时间差、刷手占比、店铺停留时间,再通过计算最优训练模型得到所述目标商品的刷单概率或者需要依赖专门的设备接收和设置防止刷单行为的动态口令和密钥,很难在大批量的数据基础上快速地分析出群体性的刷单行为并对这些行为进行可疑度的排序。
针对群体性的刷单行为,经过研究发现张量数据中的密集块往往对应着可疑的、同步的行为,比如垃圾传播者会重复去给饭馆或者旅馆写同样的、或高或低的、对自己有利的评价,或是用同样的用户、甚至是同样的文字。僵尸粉会大量去关注他们的顾客,使得粉丝数量能够很大。这种高密度的产生是归于同一个原因:垃圾传播者会受限于资源(用户、IP 地址、时间戳等),但还是想尽可能在图或者张量数据中加更多的边来最大化金钱利益。直觉上讲,数据中的行为越同步,维度越高,这个数据就越值得进一步调查。
张量模型中的密集块代表着一群用户的同步行为,密度越密集这些行为往往越可疑。张量中的密集块提取可以应用于网络入侵检测、虚假微博转发量检测、僵尸粉分析以及遗传学相关研究。本发明引进张量中的密集块分析技术解决网络平台虚假刷单的分析问题。
密集块的定义:在邻接矩阵A(大小为M×N,密度为D),一个大小为m×n的块(S,T)可以被叫做“密集块”,当且仅当密度d(S,T)比均一密度要高,即d(S,T)≥,其中是矩阵的阈值密度。
使用密集块计算来推测虚假销售行为模式,基本思想是虚假销售行为在图形中呈现密集行为的连接模式,邻接矩阵的特征子空间会呈现特殊的连接模式,通过呈现的特殊连接模式来分析网络购物、电子商务等平台的虚假销售、恶意刷单的行为。
现有技术中对张量中的密集块进行快速准确的检测的方法有:
第一种是基于张量分解的密集块挖掘,张量分解应用于对密集子张量的挖掘。基于张量分解的密集块挖掘方法存在着几点缺点:没考虑背景数据的性质;在密度指标下不具有较高延展性;不能提供合理的边界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亚鸿世纪科技发展有限公司,未经北京亚鸿世纪科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810767589.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于标识的防伪系统及其防伪方法
- 下一篇:一种学籍信息存储系统