[发明专利]一种基于GRU神经网络的广告点击率预测方法有效
申请号: | 201810675109.3 | 申请日: | 2018-06-27 |
公开(公告)号: | CN108875916B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 邵勇;田武;阎长顺;石宇良;张正龙 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q10/04;G06Q30/02 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gru 神经网络 广告 点击率 预测 方法 | ||
本发明公开一种基于GRU神经网络的广告点击率预测方法。在数据预处理时,构建了基于广告的时间序列数据,相比于用户序列数据,增强了序列数据之间的完整性和稳定性;然后通过one‑hot编码对文本特征进行数字化编码且只取映射值中bit值为1的下标作为字符的映射值,这样极大减少了特征的维度,提高了模型的训练速度。本发明采用了回归算法与深度学习算法相结合来形成最终的预测方法。首先用岭回归算法进行特征选择,减少了无效特征对模型训练的干扰,然后用基于LSTM神经网络改进的GRU神经网络来进行模型的训练与预测,GRU的预测模型相比于RNN的预测模型能提高预测的准确率,相比于LSTM的预测模型,它能在提升预测的准确率的同时,能更快速地进行模型的训练。
技术领域
本发明涉及搜索引擎网络广告技术领域,尤其涉及一种基于深度学习中的GRU神经网络的广告点击率预测方法
背景技术
互联网的快速普及与发展,使得搜索引擎的作用日益增大。根据第41次《中国互联网发展状况统计报告》可知中国的搜索引擎用户数量达到6.4亿人。基于搜索引擎的广告推广成为当前非常热门的一种广告推广方式。
对于网络广告点击率的预测,由最早期用历史点击率的值作为预测值发展到基于传统的机器学习算法(如逻辑回归、决策树和贝叶斯算法等)的预测点击率预方法,再到当前的基于神经网络和深度学习算法的预测。在学习非线性特征之间的联系和训练海量数据方面,神经网络相比与传统的机器学习方法效果更好、速度更快。但是目前为止,大部分基于神经网络的点击率预测方法都是着重于特征的处理和选择,期望得到更好的特征,以此来进一步提高模型预测的准确率。如中国专利说明书CN105654200A《一种基于深度学习的广告点击率预测方法及装置》和CN106529721A《一种深度特征提取的广告点击率预测系统及其预测方法》等都是构建合适的特征,来训练出更好的预测模型。上述的方法都局限于特征之间的关系,却忽视了数据之间的依赖性的关系。这使得广告点击率预测的准确率有所偏差。zhang 等人提出了基于递归神经网络(RNN)的点击率预测方法。在该方法中,张等人将每个用户的浏览行为记录作为一个序列,用RNN模型来模拟数据之间的依赖关系。但由于每个用户行为的不稳定性,难以构建完整且稳定的用户序列数据,这极大的降低了预点击率预测的准确性;除此之外,RNN模型在训练时会出现梯度爆发或消失的问题,这也使得模型的预测变得不稳定。
发明内容
为了解决上述不足,笔者从广告的角度出发,对搜索引擎数据分析,结果与zhang等人的分析结果类似,同一广告的初始点击率对后续点击率存在一定的而影响,当该广告被点击的后续一段时间内,被点击的概率更高。所以本发明提出构建基于时间的广告序列数据来代替zhang等人提出的用户序列数据,这样既体现了数据之间的顺序依赖性和前后点击的正相关性,又保证了序列数据的完整性。然后根据岭回归算法进行特征选择,最后用基于GRU的预测模型代替RNN的预测模型拟合序列数据之间的依赖,从而进行更准确、更高效的点击率预测。
本发明所采用的技术方案如下:
一种基于GRU神经网络的广告点击率预测方法:
步骤1、获取原始数据。得到的数据为用户点击每条广告的数据信息和广告的信息数据;
步骤2、对数据进行预处理。对数据进行分析,去除用户无效点击的数据,然后拼接两类数据信息,以天为时间单位,统计每条广告的数据和点击率。最后根据多重插补方法把数据的缺失值补全。
作为优选,步骤2具体包括以下步骤:
步骤2.1、设置广告页面无效点击的时间界限,当用户停留在广告页面的时间超过20秒时,则将该点击的数据标为有效点击,否则标为无效点击;
步骤2.2、多重插补方法针对数据缺失率超过20%的数据难以进行很精确的补充,所以去除缺失超过20%的数据,然后剩余缺失的数据用多重插补法进行补充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810675109.3/2.html,转载请声明来源钻瓜专利网。