[发明专利]一种基于VideoBag特征的精准广告投放系统及方法有效
申请号: | 201210009483.2 | 申请日: | 2012-01-13 |
公开(公告)号: | CN102708497A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 王晓龙;姚键;尹玉宗;卢学裕;严金龙;潘柏宇;卢述奇 | 申请(专利权)人: | 合一网络技术(北京)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于互联网技术领域,特别涉及一种广告投放系统及方法。其技术方案是:一种基于VideoBag特征的精准广告投放系统,包括以下模块:用户数据采集模块(1),视频节目鉴别能力计算和排序模块(2),VideoBag打包模块(3),权重计算模块(4),用户特征表生成模块(5),用户性别分类模型训练模块(6),用户年龄段分类模型训练模块(7),用户性别与年龄段预测模块(8),广告投放模块(9),它根据某广告投放的目标人群,向具有适合性别、年龄段标签的用户投放该广告。本发明直接利用用户的观看行为对目标受众进行高精度的性别、年龄的分类,在较大程度上提升了广告到达目标受众的精确度,从而有效地提升了广告效果。 | ||
搜索关键词: | 一种 基于 videobag 特征 精准 广告 投放 系统 方法 | ||
【主权项】:
一种基于VideoBag特征的精准广告投放系统,其特征是:它包括:用户数据采集模块(1),视频节目鉴别能力计算和排序模块(2),VideoBag打包模块(3),权重计算模块(4),用户特征表生成模块(5),用户性别分类模型训练模块(6),用户年龄段分类模型训练模块(7),用户性别与年龄段预测模块(8),广告投放模块(9);所述用户数据采集模块(1)获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;所述视频节目鉴别能力计算和排序模块(2)利用所述用户数据采集模块(1)收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2:I1=(man_view‑woman_view)/(man_view+woman_view)I2=(in_group_view‑not_in_group_view)/(in_group_view+not_in_group_view)式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户的观看次数;将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;所述VideoBag打包模块(3)将所述视频节目鉴别能力计算和排序模块(2)给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;所述权重计算模块(4)计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight:所述用户特征表生成模块(5)从所述用户数据采集模块(1)获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分由于用户测试;所述用户性别分类模型训练模块(6)使用支持向量机作为分类器,按照机器学习 分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块(5)提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成模块(5)提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;所述用户年龄段分类模型训练模块(7)使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块(5)提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成模块(5)提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;所述用户性别与年龄段预测模块(8)对所述用户数据采集模块(1)获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;所述广告投放模块(9)根据所述用户性别与年龄段预测模块(8)给出的用户性别、年龄段标签,以及所述用户数据采集模块(1)收集的用户性别、年龄信息,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一网络技术(北京)有限公司,未经合一网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210009483.2/,转载请声明来源钻瓜专利网。