[发明专利]基于GAN的网站流量真实度度量方法、系统及存储介质在审

专利信息
申请号: 202210373687.8 申请日: 2022-04-11
公开(公告)号: CN114782083A 公开(公告)日: 2022-07-22
发明(设计)人: 张浩 申请(专利权)人: 北京星合之星网络科技有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06N3/04;G06N3/08;G06F16/2458;G06F16/951;G06F11/34
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 房鑫
地址: 100089 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 gan 网站 流量 真实 度量 方法 系统 存储 介质
【说明书】:

一种基于GAN的网站流量真实度度量方法、系统及存储介质,方法包括收集网站点击事件数据;使用网站点击事件数据构造行为序列;训练生成对抗网络模型,利用生成对抗网络模型中的生成器不断生成模拟的行为序列,判别器不断的学习如何判别序列是真实的还是虚假的,直至生成器和判别器的损失不再下降时终止训练,获得训练好的生成对抗网络模型;使用训练好的生成对抗网络模型的判别器,对构造的行为序列的真实度进行判别度量。系统包括数据收集模块、行为序列构造模块、网络模型训练模块以及真实度判别模块。本发明能够实现更加精准的识别,使用机器学习的方法来学习用户的行为规律,可以发现一些人工无法发现的规律,可以适配不同的网站。

技术领域

本发明属于广告展示效果监测技术领域,具体涉及一种基于GAN的网站流量真实度度量方法、系统及存储介质。

背景技术

流量作弊在广告行业已经成为公开的秘密,其中有大量的非人为流量(No-HumanTraffic),来自总部位于弗吉尼亚州的Distil Networks—一个机器人(bot)监测和API安全专家的最新报告显示,2018年超过1/3的网络流量是由机器人驱动的,其中,超过20%是通过“坏机器人”(与搜索引擎爬虫等善意bot相反)驱动的,这一数据比2017年增长了6.4%。bot是一种用于在线执行重复任务的自动化软件脚本/应用程序,国内市场常见的模拟器包括:网易MUMU模拟器、雷电模拟器、逍遥模拟器、夜神模拟器和蓝叠模拟器等,这些模拟器可以随意修改地理位置、手机的设备参数等信息,作弊者使用模拟器来模拟用户访问网站、点击广告,以此来骗取广告主的营销费用。而站长一般都是真假流量掺混在一起进行售卖,以此来扩大自己的网站收益并避免被检测机构发现作弊行为,因此,就需要检测网站用户的真实度,即网站是否存在掺量行为、以及掺量比例。

传统的检测方案基本都是基于人工规则,比如用户的访问频次、IP是否是机房IP、IP的离散度等。这些检测方法还存在以下方面的弊端:

1)规则一旦确定,很少去修改,无法适应情况的变化。

2)规则依赖人的经验和主观判断,无法做到客观。

3)不同的网站情况不同,一刀切的规则,难以满足识别的要求。

发明内容

本发明的目的在于针对上述现有技术中的问题,提供一种基于GAN的网站流量真实度度量方法、系统及存储介质,避免人工规则的死板和主观性,能够实现更加精准的识别。

为了实现上述目的,本发明有如下的技术方案:

一种基于GAN的网站流量真实度度量方法,包括:

收集网站点击事件数据;

使用网站点击事件数据构造行为序列;

训练生成对抗网络模型,利用生成对抗网络模型中的生成器不断生成模拟的行为序列,判别器不断的学习如何判别序列是真实的还是虚假的,直至生成器和判别器的损失不再下降时终止训练,获得训练好的生成对抗网络模型;

使用训练好的生成对抗网络模型的判别器,对构造的行为序列的真实度进行判别度量。

作为本发明基于GAN的网站流量真实度度量方法的一种优选方案,所述收集网站点击事件数据的步骤使用JavaScript从网站前端页面收集设备相关参数和点击行为日志。

作为本发明基于GAN的网站流量真实度度量方法的一种优选方案,所述收集网站点击事件数据的步骤具体包括:将JavaScript脚本部署在媒体网站,当前页面加载时,同步加载并执行所部署的JavaScript脚本,获得当前页面的文档对象模型DOM以及事件Event的信息,据此捕获当前页面的所有信息以及用户在当前页面的操作记录。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京星合之星网络科技有限公司,未经北京星合之星网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210373687.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top