[发明专利]标签数据处理方法、装置、设备和存储介质在审
申请号: | 202011037355.X | 申请日: | 2020-09-27 |
公开(公告)号: | CN112015775A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 全威龙;王冬;赵煜杨 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/215;G06F16/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 数据处理 方法 装置 设备 存储 介质 | ||
本申请公开了标签数据处理方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:根据当前用户标识信息,确定当前用户分段号;根据所述当前用户分段号,确定当前用户分桶号;将所述当前用户的标签数据存储到与所述当前用户分桶号关联的数据桶中,且将所述数据桶内的用户标签数据聚合成位图数据进行存储。本申请能够降低标签数据存储空间。
技术领域
本申请涉及数据处理技术领域,尤其涉及大数据技术领域,具体涉及一种标签数据处理方法、装置、设备和存储介质。
背景技术
随着用户画像与特征工程的不断发展,用户标签数据的维度日益丰富,应用场景也不断丰富。例如,业务方可以根据用户画像及行为特征定向定位人群,对人群内的用户进行精准触达,从而可以有效提升业务方的经营效率,增加用户黏性。
业务方每天的标签数据在TB(万亿字节)级别以上,如何对标签数据进行存储、查询等处理是业内重要问题。
发明内容
本公开提供了一种用于标签数据处理方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种标签数据处理方法,包括:
根据当前用户标识信息,确定当前用户分段号;
根据所述当前用户分段号,确定当前用户分桶号;
将所述当前用户的标签数据存储到与所述当前用户分桶号关联的数据桶中,且将所述数据桶内的用户标签数据聚合成位图数据进行存储。
根据本公开的一方面,提供了一种标签数据处理装置,包括:
分段模块,用于根据当前用户标识信息,确定当前用户分段号;
分桶模块,用于根据所述当前用户分段号,确定当前用户分桶号;
数据存储模块,用于将所述当前用户的标签数据存储到与所述当前用户分桶号关联的数据桶中,且将所述数据桶内的用户标签数据聚合成位图数据进行存储。
根据第三方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例中任一项所述的标签数据处理方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例中任一项所述的标签数据处理方法。
根据本申请的技术能够降低标签数据存储空间。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1a是根据本申请实施例提供的一种标签数据处理方法的流程示意图;
图1b是根据本申请实施例提供的一种位图数据示意图;
图2是根据本申请实施例提供的另一种标签数据处理方法的流程示意图;
图3a是根据本申请实施例提供的又一种标签数据处理方法的流程示意图;
图3b是根据本申请实施例提供的一种全局字典工作示意图;
图3c是根据本申请实施例提供的一种标签数据处理示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011037355.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:针剂柜智能存取系统
- 下一篇:一种房屋装饰用颜料喷洒装置