[发明专利]一种RTB竞价广告位价值分析方法及系统有效

专利信息
申请号: 201611260895.8 申请日: 2016-12-30
公开(公告)号: CN106874368B 公开(公告)日: 2020-12-22
发明(设计)人: 陈辉;许恺;黄强松;黄娟 申请(专利权)人: 江苏号百信息服务有限公司
主分类号: G06F16/951 分类号: G06F16/951;G06F16/182;G06F16/955;G06Q30/02
代理公司: 南京钟山专利代理有限公司 32252 代理人: 戴朝荣
地址: 210006 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 rtb 竞价 广告位 价值 分析 方法 系统
【权利要求书】:

1.一种RTB竞价广告位价值分析方法,其特征在于:包括如下步骤:

一、输入互联网的网络数据到Hadoop集群中,并运用Hadoop集群的MapReduce模块,编写Mapper和Reducer函数,统计出每个host出现的数目,并将统计结果写入Hadoop FS文件系统中;

二、将统计结果从Hadoop FS文件系统中导出,并导入Redis数据库,在Redis中,过滤掉访问大于上限次数和小于下限次数的网站的URL,并使得文本以特定的格式保存,得到URL列表文件;

三、依据获得RTB竞价中高价值网站的URL列表文件,编写网络爬虫去爬取每个网站的html源码,依据广告的特征计算出html源码中广告的属性,并将所述属性保存为广告统计结果文件;

四、将所述广告统计结果文件与URL列表文件合并,依据访问量进行排序,获得RTB竞价中高价值网站的广告统计列表,对网站广告价值评分标准建模,并对Hadoop筛选结果和爬虫结果进行量化分析;

在步骤四中分析得到的结果为:网站广告位的价值分别与网站访问量及排名、网站精美度、网站广告位数量和网站非法性有关;

在对所述网站访问量及排名的量化分析中,适中访问量的量化标准为:

在对所述网站精美度的量化分析中,精美度影响系数Q的量化标准为:

其中,G为网站精美度的贡献系数,T和W分别为网页中图片链接数和文字链接数;

在对所述网站广告位数量的量化分析中,设内嵌广告位的数量价值系数为P,q为内嵌广告位数量,计算公式为:

在对所述网站非法性的量化分析中,设非法系数为F,根据经验对所述非法系数F进行判断。

2.根据权利要求1所述的RTB竞价广告位价值分析方法,其特征在于:在步骤一中,具体包括如下步骤:

从每条DPI日志的URL字段中抽取Host;

在每个Mapper中建立字典,字典的Key为Host字符串,值为该Key出现的频次,每当有重复的Key出现时,对应的值就增加一,当Mapper的循环结束时,将字典的信息Key和Value打印出来交由Reducer汇总统计;

在Reducer中,Mapper的输出被还原为字典,Key为Host字符串,值为Mapper阶段各个节点的输出,随后Reducer对相同的Key进行值合并,得到最终的频次之和,并统计输出;

将统计结果写入Hadoop FS文件系统中。

3.根据权利要求1所述的RTB竞价广告位价值分析方法,其特征在于:在步骤二中,网站访问次数的上限次数和下限次数均建模得出,建模公式为:

其中,Nf表示判断RTB竞价高价值网站访问次数上限次数,Nb表示高价值网站访问次数下限次数,M表示网站的总个数,N1、N2、…NM分别代表网站访问从第一至第M个的网站的访问次数。

4.根据权利要求1所述的RTB竞价广告位价值分析方法,其特征在于:所述高价值网站为网站访问量处于Nf、Nb之间的网站。

5.根据权利要求1所述的RTB竞价广告位价值分析方法,其特征在于:在步骤三中,具体包括如下步骤:

根据URL对指定网页进行内容获取;

使用爬虫爬取网页的标题、关键字、描述和正文的字段,并将爬取的结果作为值,网页URL作为键,以文本的形式存入HDFS中,随后利用基于hadoop的分布式分词软件,对海量文本数据进行分词处理;

对于源码本身,则进行多模式匹配,寻找源码中的加载广告位的代码,用于分析其网页中广告位的信息,并输出到爬虫结果文件中;

爬取网站网页的编写模板和插件,以及图片超链接数量和文字超链接数量,来确定网站精美度。

6.根据权利要求1所述的RTB竞价广告位价值分析方法,其特征在于:在步骤三中,所述广告的属性包括网站精美度、网站广告位数量和网站非法性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏号百信息服务有限公司,未经江苏号百信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611260895.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top