[发明专利]受众扩展方法及装置在审
| 申请号: | 201910105717.5 | 申请日: | 2019-02-01 |
| 公开(公告)号: | CN110059244A | 公开(公告)日: | 2019-07-26 |
| 发明(设计)人: | 郭晓波;钟明洁 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 业务特征 显著特征 度量 候选用户集合 候选用户 扩展目标 用户集合 权重 用户确定 受众 | ||
本公开提供了一种扩展目标用户的方法,包括:针对多个业务特征中的每一个业务特征,确定种子用户集合中满足该业务特征的种子用户总数并根据该种子用户总数来确定该业务特征的种子占比值;针对所述多个业务特征中的每一个业务特征,确定候选用户集合中满足该业务特征的候选用户总数并根据该候选用户总数来确定该业务特征的候选占比值;根据所述多个业务特征的多个种子占比值和多个候选占比值来确定所述多个业务特征中的多个显著特征以及所述多个显著特征的权重;为候选用户集合中的每个用户确定显著特征度量,所述显著特征度量是用户所满足的所述显著特征的权重的总和;以及根据所述显著特征度量来确定扩展目标用户集合。
技术领域
本公开一般涉及互联网技术领域,尤其涉及基于受众扩展方法及装置。
背景技术
随着互联网技术的发展,人们越来越频繁地浏览网络平台提供的内容信息。在网络上对特定的产品进行宣传营销时,希望向较多的人群提供更有针对性的内容投放。
现有技术方案中,将在特定业务场景下收集到的,对产品、服务有相同需求和兴趣的人群称为种子人群,种子人群通常数量不多,一般在十万以下。可对种子人群进行扩展,将扩展人群作为业务推送的最终目标用户。
期望一种对种子人群进行扩展的高效方法。
发明内容
为解决上述技术问题,本公开的一个方面在于利用种子用户发现其相似人群作为受众扩展人群。具体而言,首先选取种子用户及期望的扩展规模,基于已有种子用户的显著特征,以及候选人群的全局特征数据,通过IV(information value,信息值)构建显著特征矩阵,选取整体排序大于特定阈值或排名靠前的用户作为最终受众扩展群体。
本公开提供了一种扩展目标用户的方法,包括:
针对多个业务特征中的每一个业务特征,确定种子用户集合中满足该业务特征的种子用户总数并根据该种子用户总数来确定该业务特征的种子占比值;
针对所述多个业务特征中的每一个业务特征,确定候选用户集合中满足该业务特征的候选用户总数并根据该候选用户总数来确定该业务特征的候选占比值;
根据所述多个业务特征的多个种子占比值和多个候选占比值来确定所述多个业务特征中的多个显著特征以及所述多个显著特征的权重;
为候选用户集合中的每个用户确定显著特征度量,所述显著特征度量是用户所满足的所述显著特征的权重的总和;以及
根据所述显著特征度量来确定扩展目标用户集合。
可任选地,业务特征的种子占比值是满足所述业务特征的种子用户数量与种子用户总数之比,并且业务特征的候选占比值是满足所述业务特征的候选用户数量与候选用户总数之比。
可任选地,如果业务特征的种子占比值大于阈值,则确定该业务特征为显著特征。
可任选地,如果业务特征的种子占比值与候选占比值的比率大于阈值,则确定该业务特征为显著特征。
可任选地,所述显著特征的权重根据所述显著特征的种子占比值与候选占比值之差来确定。
可任选地,所述确定所述多个显著特征的权重包括:针对每个显著特征,使用其种子占比值和候选占比值计算IV(信息值)以确定该显著特征的权重。
可任选地,该方法进一步包括:
为所述种子用户集合和候选用户集合中的每个用户构建特征向量,所述特征向量中的每个元素表示用户是否满足对应特征;
构建显著特征矩阵,所述显著特征矩阵为对角矩阵,其中所述显著特征矩阵中对应于每个显著特征的元素表示该显著特征的权重并且其它元素为0;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910105717.5/2.html,转载请声明来源钻瓜专利网。





