[发明专利]一种基于FFM深度神经网络的点击率预估方法在审
申请号: | 201910123419.9 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109829129A | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 邱威;史景伦 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预估 神经网络 训练数据 点击率 预处理 数据通过 重新编码 离散化 神经网络模型 神经网络实现 高阶信息 生活领域 自动组合 能力强 低阶 预测 应用 学习 | ||
1.一种基于FFM深度神经网络的点击率预估方法,其特征在于,包括以下步骤:
1)将训练数据中的数据离散化;
2)对离散化的训练数据进行重新编码;
3)将重新编码后的训练数据通过FFM深度神经网络进行训练;
4)将需要预测的数据通过预处理;
5)将预处理过的数据通过训练过的神经网络实现点击率的预估。
2.根据权利要求1所述的一种基于FFM深度神经网络的点击率预估方法,其特征在于:在步骤1)中,由于数据中存在离散型数据和连续型数据,为了满足神经网络的输入要求,需将连续性型数据通过离散化操作变成离散型数据,离散型数据则不做处理,这样的处理不会影响神经网络的学习效果。
3.根据权利要求1所述的一种基于FFM深度神经网络的点击率预估方法,其特征在于:在步骤2)中,对离散化后的数据进行重新编码,包括改变数据的起始值和最大值,这样做能够提高模型的精度和训练效率,防止过拟合。
4.根据权利要求1所述的一种基于FFM深度神经网络的点击率预估方法,其特征在于:在步骤3)中,构造FFM神经网络并训练,对于点击率的预估,数据包括各个维度的数据,所以在训练网络时输入的是各个维度的离散化数据,标签根据用户是否产生点击行为标记为1或0,训练时,将训练数据通过embedding层,对输入的数据进行向量化操作,再分别经过线性层和深度神经网络层,其中深度神经网络层包括特征交叉层和全连接层,再将线性层的结果和深度神经网络层的结果相加并通过sigmoid函数,最后采用Logloss作为代价函数;而后再采用反向传播算法训练神经网络。
5.根据权利要求1所述的一种基于FFM深度神经网络的点击率预估方法,其特征在于:在步骤4)中,在使用网络时,输入为要预测点击率的各个维度的数据,将各个维度的数据做相同的预处理,将数据离散化并重新编码。
6.根据权利要求1所述的一种基于FFM深度神经网络的点击率预估方法,其特征在于:在步骤5)中,将处理过的各个维度的数据正向传播通过训练过的FFM深度神经网络,实现点击率的预估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910123419.9/1.html,转载请声明来源钻瓜专利网。