[发明专利]一种模型训练以及信息推荐方法及装置在审
申请号: | 202110690817.6 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113343095A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 段琼;黄祥洲;张梦迪;周翔;陈胜 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06K9/62;G06N3/08 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 以及 信息 推荐 方法 装置 | ||
本说明书公开了一种模型训练以及信息推荐方法及装置,可先根据用户历史搜索的各关键词、商家、商家属性及其之间的关联关系,确定图数据。之后,从用户的行为日志数据中确定搜索的关键词,以及与该关键词关联的各商家。并根据该用户的用户特征、从图数据中确定出的关联的各商家节点的节点特征以及该关键词节点的节点特征,确定各训练样本的样本数据。然后,根据行为日志数据中的业务执行结果,对各训练样本进行标注。最后,通过各训练样本及其标注,训练点击预估模型。通过结合图数据中各关联节点的关联信息进行模型训练,提升了样本信息的丰富度,使模型输出结果更准确。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种模型训练以及信息推荐方法及装置。
背景技术
一般的,用户在外卖平台中搜索商品时,搜索结果通常会以商家列表的形式展现,而展示列表的排序对于引导用户成交量至关重要。
现有技术在确定展示列表中各商家的排序时,可先基于用户输入的查询关键词,召回与该关键词相关的若干商家。之后,根据该用户的浏览、点击、下单等行为特征以及各商家的评价、订单量等统计特征,通过预先训练的点击预估模型(Click-Through-Rat,CTR),确定用户点击各商家的预估得分,并根据各商家的预估得分,对召回的各商家进行排序。其中,常见的CTR模型有深度交叉网络模型(DeepCross Network,DCN)、深度分解机模型(Deep Factorization-Machine,DeepFM)、广度深度结合模型(WideDeep)等。
但是,仅聚焦于查询关键词和商家本身的特征进行排序,排序结果的质量往往较差,且会导致“排序靠前的商家愈靠前,排序靠后的商家愈靠后”。
发明内容
本说明书实施例提供一种模型训练以及信息推荐方法及装置,用于部分解决现有技术中的问题。
本说明书实施例采用下述技术方案:
本说明书提供的一种模型训练方法,包括:
根据用户历史的行为日志数据,确定所述用户搜索的各关键词与各商家之间的关联关系,以及各关键词与各商家属性之间的关联关系,并分别以各关键词、各商家以及各商家属性为节点,根据各节点之间的关联关系,确定图数据;
针对每条行为日志数据,确定该行为日志数据中搜索的关键词,以及与所述关键词关联的各商家,并针对关联的每个商家,根据该商家节点的节点特征、所述关键词节点的节点特征以及该行为日志数据对应用户的用户特征,确定训练样本的样本数据;其中,各节点的节点特征基于所述图数据中与所述节点关联的各其它节点确定;
根据该行为日志数据中的业务执行结果,确定各训练样本的标注;
针对每个训练样本,将该训练样本的样本数据作为输入,输入待训练的点击预估模型,确定该训练样本的预估得分,并以最小化所述训练样本的预测得分与标注之间的差异为目标,调整所述点击预估模型中的模型参数。
可选地,根据所述用户的行为日志数据,确定所述用户搜索的各关键词与各商家之间的关联关系,具体包括:
针对每个关键词,根据所述行为日志数据中各用户搜索该关键词后在各商家的下单次数,确定该关键词与各商家的关联关系;其中,所述下单次数与所述关联关系中的关系权重呈正相关;
根据所述用户的行为日志数据,确定各关键词与各商家属性之间的关联关系,具体包括:
针对每个关键词,根据所述行为日志数据中各用户搜索该关键词后下单商家对应的商家属性,确定该关键词与各商家属性的关联关系。
可选地,基于所述图数据确定节点的节点特征之前,所述方法还包括:
以最大化所述图数据中相连节点的特征相似度,以及最小化所述图数据中不相连节点的特征相似度为目标,调整所述图数据中的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110690817.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种垃圾桶
- 下一篇:一种基于变分自编码器的机械设备退化点识别方法和系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置