[发明专利]一种基于深度学习的商品点击率预测方法有效
申请号: | 201910698575.8 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110555719B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 许勇;李倩婷 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q30/0202;G06Q30/0601;G06F40/284;G06F18/22 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈宏升 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 商品 点击率 预测 方法 | ||
1.一种基于深度学习的商品点击率预测方法,其特征在于,包括以下步骤:
S1、获取商品信息,并通过商品信息计算商品相似度,建立商品相似度函数;
S2、根据商品销售时间进行分类,对于缺失商品销售时间序列的商品,通过商品相似性函数进行近似值排序,选择近似值排序最大的商品进行填充,得到多变量时间序列;
S3、将多变量时间序列输入时序模型,进行深度网络学习迭代,得到迭代后的特征时间序列,具体为:
对于多变量时间序列,
其中,xt,t∈{1,2,...,T}表示在时间st商品的销售记录;
为了区分本商品真实观测值和近似商品填充值的差别,定义:
其中,mt,t∈{1,2,...,T}表示在时间st,xt是否为商品的真实销售记录,若有记录,则mt取值为1;若没有记录,则mt取值为0;
定义:
其中,δt表示商品A的真实销售记录距离上一个真实销售记录的时间间隔;
将多变量时间序列输入时序模型,进行深度网络学习迭代,得到特征时间序列,同时按照真实销售记录的时间间隔对时序模型的隐藏状态进行衰减,区分主商品和填充商品在数据序列中的重要性;定义在时间步t时刻的衰减因子γt,用sigmoid函数对衰减因子控制在0到1之间,则有:
γt=sigmoid{-max(0,Wγδt+bγ)},
其中,Wγ表示作用在时间间隔上权重矩阵,bγ表示偏置,γt为时间步t时刻的衰减因子;
隐藏状态从当前状态一直衰减至零,隐藏状态的每个特征都有同样的衰减因子,衰减因子与隐藏状态做哈达玛积之后得到衰减隐藏状态;在每一个时间步计算之前都把隐藏状态进行衰减,然后用GRU更新方程进行迭代,得到特征时间序列:
其中,N1是GRU隐藏单元的数量,gt,t∈{1,2,…,T}表示在时间步t时刻时序模型的隐藏状态;
把每个时间步的隐藏状态输出到一个全连接层,得到每个时间步的点击率预测值;
S4、对商品用独热编码,得到商品词向量,经过排序,得到商品词向量序列,将特征时间序列与商品词向量序列进行交互,得到交互时间序列;
S5、分别计算得到特征时间序列的损失值和交互时间序列的损失值,通过全连接网络得到商品的预测点击率。
2.根据权利要求1所述的一种基于深度学习的商品点击率预测方法,其特征在于,所述商品信息包括商品图片、商品标题、商品价格、商品品牌。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910698575.8/1.html,转载请声明来源钻瓜专利网。