[发明专利]基于自注意力自编码器的序列推荐方法在审
申请号: | 201911369965.7 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111127165A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 谭军;杜建伟;钟鸣;林鑫;凌洁静 | 申请(专利权)人: | 纪信智达(广州)信息技术有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q10/06;G06N3/04;G06N3/08;G06F17/16 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510235 广东省广州市海珠区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 编码器 序列 推荐 方法 | ||
1.基于自注意力自编码器的序列推荐方法,其特征在于,包括以下步骤:
S1:获取用户商品序列和评分矩阵,并对商品序列进行预处理;
S2:使用自注意力模型对商品序列进行训练,预测用户与商品的关联性得分;
S3:使用自编码器对评分矩阵重建,计算用户喜爱度指数;
S4:结合用户与商品的关联性得分和用户喜爱度指数,得到高得分的商品为用户优先推荐。
2.根据权利要求1所述的基于自注意力自编码器的序列推荐方法,其特征在于,在所述步骤S1中,对商品序列进行预处理预处理的过程具体为:
将用户u浏览的商品序列Su拆成输入序列(S1,S2,...,S|su-1|)和输出序列(S2,S3,...,S|su|),其中,输入序列作为自注意力模型编码部分的输入,输出序列作为自注意力模型解码部分的输入;
设定超参数为n的商品序列最长长度,若用户商品序列超过最长长度,则对其进行截断,保留前n个商品序列;若用户原始商品序列小于最长长度,则对其左侧进行填补,最后得到长度为n的商品序列(S1,S2,...,Sn),完成商品序列的预处理。
3.根据权利要求2所述的基于自注意力自编码器的序列推荐方法,其特征在于,所述步骤S2具体包括以下步骤:
S21:利用网络嵌入方法训练商品序列,将用户浏览的商品序列转化为低维稠密向量,结合位置编码方式得到模型的输入向量;
S22:采用多头自注意力机制对商品序列的输入向量进行建模,构建自注意力模型;
S23:将自注意力模型加上一个两层的前馈神经网络进行数据拟合,对用户与商品的关联性得分进行预测。
4.根据权利要求3所述的基于自注意力自编码器的序列推荐方法,其特征在于,所述步骤S21具体为:
利用网络嵌入方法对商品进行词向量学习,得到商品序列的嵌入矩阵M∈R|I|*d,其中|I|为商品的总数,d为嵌入向量的维度,M的每一行表示一个商品对应的向量;
使用位置编码方式,记录商品序列相对位置信息,具体计算公式为:
PE(pos,2i)=sin(pos/100002i/d)
PE(pos,2i+1)=cos(pos/100002i/d)
其中,pos表示商品序列第几个商品,d表示嵌入向量的维度,2i和2i+1表示pos为偶数或奇数对应的公式;通过三角函数的方式得到商品序列的位置向量P∈Rn*d;将商品序列的嵌入矩阵和位置向量行拼接,得到输入向量具体为:
其中:Msi和Psi(i=1,...,n)分别表示商品Si的词向量和位置向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纪信智达(广州)信息技术有限公司,未经纪信智达(广州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911369965.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:紫外光电探测器及其制备方法
- 下一篇:一种利用红细胞制备的靶向性的囊泡药物