[发明专利]一种资源推荐、模型训练方法及装置、设备及存储介质在审
申请号: | 202310063955.0 | 申请日: | 2023-01-12 |
公开(公告)号: | CN116186395A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 常健新;关琳;惠轶群 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/08 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 资源 推荐 模型 训练 方法 装置 设备 存储 介质 | ||
本公开关于一种资源推荐、模型训练方法及装置、设备及存储介质,涉及互联网技术领域,可以解决超长行为序列对应的计算量较大的问题。该方法包括:获取待推荐资源在资源特征维度的第一资源数据、账户行为在行为特征维度的行为数据的集合;根据第一资源数据、预先存储的每个历史资源在资源特征维度的第二资源数据,确定目标行为数据;目标行为数据对应的目标历史资源在资源特征维度,与待推荐资源之间的相似度大于第一预设相似度;根据第一资源数据、第三资源数据、目标行为数据,确定待推荐资源中向账户推荐的目标资源;目标资源在资源特征维度和行为特征维度,与目标历史资源之间的相似度大于第二预设相似度。
技术领域
本公开涉及互联网技术领域,尤其涉及一种资源推荐、模型训练方法及装置、设备及存储介质。
背景技术
基于点击率(click through rate,CTR)估计的目标兴趣预测模型在推荐系统中起着至关重要的作用,可以基于账户的历史行为序列,进行模型处理,得到账户针对资源的偏好程度,以使得后续可以根据偏好程度为账户推荐更感兴趣的资源。
历史行为序列可以包括账户在历史时间段内产生的多个行为数据。当历史行为序列的序列长度越大,即行为数据的数量越多时,目标兴趣预测模型得到的偏好程度更精准,同时,模型处理过程中消耗的计算资源越多,时延越长。
目前,通用方法需要针对每个行为数据进行多维的特征提取,然后比较提取后的特征数据,来预测账户对待推荐资源的兴趣。为了满足实际部署对时延和计算资源的要求,通用方法只能处理序列长度较小的历史行为序列,数量在几百个左右,导致预测结果的准确性降低。
发明内容
本公开提供一种资源推荐、模型训练方法及装置、设备及存储介质,用于解决超长行为序列对应的计算量较大的问题。
本公开实施例的技术方案如下:
根据本公开实施例的第一方面,提供一种资源推荐方法,包括:获取待推荐资源在资源特征维度的第一资源数据、账户行为在行为特征维度的行为数据的集合;账户行为用于表示账户针对每个历史资源执行的交互行为;根据第一资源数据、预先存储的每个历史资源在资源特征维度的第二资源数据,确定目标行为数据;目标行为数据对应的目标历史资源在资源特征维度,与待推荐资源之间的相似度大于第一预设相似度;根据第一资源数据、第三资源数据、目标行为数据,确定待推荐资源中向账户推荐的目标资源;目标资源在资源特征维度和行为特征维度,与目标历史资源之间的相似度大于第二预设相似度;第三资源数据为目标历史资源的第二资源数据。
可选的,根据第一资源数据、第三资源数据、目标行为数据,确定待推荐资源中向账户推荐的目标资源的方法,包括:将第一资源数据、第三资源数据、目标行为数据,输入到第一多头注意力模型中,确定第一注意力指标;第一注意力指标用于表示待推荐资源在资源特征维度和行为特征维度,与目标历史资源之间的相似度;基于第一注意力指标,确定目标资源。
可选的,将第一资源数据、第三资源数据、目标行为数据,输入到多头注意力模型中,确定第一注意力指标的方法,包括:根据第一多头注意力模型的第一参数集合、第一资源数据、第三资源数据、目标行为数据,确定待推荐资源的第一注意力权重;第一参数集合包括:资源特征维度的权重和行为特征维度的权重;根据第一注意力权重、第三资源数据、以及强化权重,确定第一注意力指标;强化权重用于提高资源特征维度的权重。
可选的,根据第一资源数据、预先存储的每个历史资源在资源特征维度的第二资源数据,确定目标行为数据的方法,包括:将第一资源数据、第二资源数据,输入到第二多头注意力模型中,确定待推荐资源的第二注意力权重;第二注意力权重用于表示待推荐资源在资源特征维度,与目标历史资源之间的相似度;根据第二注意力权重,从行为数据的集合中,确定目标行为数据。
可选的,将第一资源数据、第二资源数据,输入到第二多头注意力模型中,确定待推荐资源的第二注意力权重的方法,包括:获取资源特征维度的权重;根据资源特征维度的权重、第一资源数据、第二资源数据,确定第二注意力权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310063955.0/2.html,转载请声明来源钻瓜专利网。