[发明专利]一种基于GRU神经网络的广告点击率预测方法有效
申请号: | 201810675109.3 | 申请日: | 2018-06-27 |
公开(公告)号: | CN108875916B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 邵勇;田武;阎长顺;石宇良;张正龙 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q10/04;G06Q30/02 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gru 神经网络 广告 点击率 预测 方法 | ||
1.一种基于GRU神经网络的广告点击率预测方法,其特征在于,
步骤1、获取原始数据
得到的数据为用户点击每条广告的数据信息和广告的信息数据;
步骤2、对数据进行预处理
对数据进行分析,去除用户无效点击的数据,然后拼接广告和用户点击的数据信息,以天为时间单位,统计每条广告的数据和点击率;最后根据多重插补方法把数据的缺失值补全;
步骤3、广告序列数据的构建
在补全数据后,以天为时间单位,将每条广告进行先后排序,构成基于时间的广告序列数据,且将数据分为两类,一类为特征数据,另一类为点击率的真实值;
步骤4、对广告序序列数据进行特征选择
先对文本特征进行one-hot编码,且对数据特征进行归一化处理,然后采用Embedded方法对归一化后的数据特征进行进一步特的征选择;
步骤5、基于GRU神经网络的模型的构建
采用keras框架进行基于GRU神经网络的模型构建;
步骤6、模型的训练与测试
将序列数据按照时间顺序分为前后两个同等时间长度的数据块,第一部分广告序列数据作为训练数据特征,对应的点击率作为训练数据的真实结果,第二部分作为测试数据特征,对应的点击率作为测试数据的真实结果;模型的训练是将处理好的数据导入模型并进行前向传播和后向传播算法的多次轮询训练;在模型收敛的同时,使得损失函数的值尽可能的趋于0且AUC值尽可能的趋于1;在训练完成后,用测试数据进行点击率的预测。
2.如权利要求1所述的基于GRU神经网络的广告点击率预测方法,其特征在于,步骤2具体包括以下步骤:
步骤2.1、设置广告页面无效点击的时间界限,当用户停留在广告页面的时间超过20秒时,则将该点击的数据标为有效点击,否则标为无效点击;
步骤2.2、多重插补的方法只补充缺失率不超过20%的缺失值,超过20%的数据则直接去除。
3.如权利要求1所述的基于GRU神经网络的广告点击率预测方法,其特征在于,步骤4具体包括以下步骤:
步骤4.1、把经过one-hot编码的字符的映射值中bit值为1的下标作为字符的映射值,每一个字符对应一个数字特征;
步骤4.2、采用Embedded方法中的岭回归算法对经过归一化的特征进行特征选择;当特征的系数趋近于0或等于0,去掉这些特征,剩下的特征即为所需的特征。
4.如权利要求1所述的基于GRU神经网络的广告点击率预测方法,其特征在于,步骤5具体包括以下步骤:
步骤5.1、模型构建四层,前三层为GRU层,最后一层为Dense层,且最后一层的激活函数选为sigmoid函数;
步骤5.2、损失函数采用logloss函数,优化函数则采用的是SGD,且SGD的学习率设置为0.1,将AUC和logloss函数的值作为评价指标。
5.如权利要求1所述的基于GRU神经网络的广告点击率预测方法,其特征在于,步骤6具体包括以下步骤:
步骤6.1、选取两周数据,第一周的序列数据作为训练数据,第二周的广告序列数据作为测试数据;
步骤6.2、模型训练中轮询的次数设置为50次:模型通过前向传播算法和后向传播算法对一周数据进行50次的轮询训练,实现权重参数的的多次更新,使模型趋于稳定且达到最优值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810675109.3/1.html,转载请声明来源钻瓜专利网。