[发明专利]广告召回方法及装置、系统、计算机存储介质、电子设备在审
| 申请号: | 202010771658.8 | 申请日: | 2020-08-04 |
| 公开(公告)号: | CN113792184A | 公开(公告)日: | 2021-12-14 |
| 发明(设计)人: | 徐昊;殷威;肖智鹏;王浩;胡景贺;颜伟鹏 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903;G06F16/906;G06Q30/02 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 广告 召回 方法 装置 系统 计算机 存储 介质 电子设备 | ||
本公开提供了一种广告召回方法及装置、系统、计算机存储介质、电子设备,该方法包括:获取广告更新数据,对所述广告更新数据进行预处理,以获取目标广告更新数据;根据所述目标广告更新数据生成索引树高度;根据所述索引树高度、目标节点包含的数据量和所述目标节点对应的层级对所述目标广告更新数据进行聚类,以形成索引树;根据前端广告召回请求在所述索引树中进行检索,并将检索得到的目标广告数据返回至前端。本公开一方面提高了索引树构建的效率,并且降低了内存和耗时;另一方面保证了索引树高度的可控性以及数据的分散性和均衡性,使得索引树的结构更稳定,索引结果更精准。
技术领域
本公开涉及索引构建技术领域,特别涉及一种广告召回方法、广告召回装置、广告召回系统、计算机可读存储介质及电子设备。
背景技术
在线广告是一种常见的商业变现方式,对于在线广告而言,广告索引的结构和实现方式会直接影响广告系统的服务性能。随着机器学习、深度神经网络的发展,数据向量化已经成为一种趋势。向量化索引是通过数学量化模型,对向量构建一种时间和空间都比较高效的数据索引结构。
目前向量化索引方法主要有四大类,基于树的方法、哈希方法、矢量化方法和基于图的方法,但是现有的向量化索引方法存在构建难度大、内存消耗大,并且检索效率较慢的问题。
鉴于此,本领域亟需开发一种新的广告召回方法及装置。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种广告召回方法、广告召回装置、广告召回系统、计算机可读存储介质及电子设备,进而至少在一定程度上提高索引构建效率,减小内存消耗,并且能够提高检索效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种广告召回方法,包括:
获取广告更新数据,对所述广告更新数据进行预处理,以获取目标广告更新数据;
根据所述目标广告更新数据生成索引树高度;
根据所述索引树高度、目标节点包含的数据量和所述目标节点对应的层级对所述目标广告更新数据进行聚类,以形成索引树;
根据前端广告召回请求在所述索引树中进行检索,并将检索得到的目标广告数据返回至前端。
在本公开的示例性实施例中,所述根据所述目标广告更新数据生成索引树高度,包括:
获取所述目标广告更新数据的数量级信息,并获取所述数量级信息的常用对数值;
将所述常用对数值和预设值中的最大值作为所述索引树高度。
在本公开的示例性实施例中,所述目标节点为所述索引树中已存在节点中的任意一个;
所述根据所述索引树高度、目标节点包含的数据量和所述目标节点对应的层级对所述目标广告更新数据进行聚类,以获取索引树,包括:
根据所述索引树高度、所述目标节点包含的数据量和所述目标节点对应的层级确定所述目标节点对应的聚类数;
根据所述聚类数对所述目标节点中的广告数据进行聚类;
遍历所述索引树中的所有目标节点,重复上述步骤,直至达到结束条件,以获取所述索引树。
在本公开的示例性实施例中,所述根据所述索引树高度、所述目标节点包含的数据量和所述目标节点对应的层级确定所述目标节点对应的聚类数,包括:
获取所述索引树高度与所述目标节点对应的层级之间的差值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010771658.8/2.html,转载请声明来源钻瓜专利网。





