[发明专利]样本生成的方法及装置有效
申请号: | 201910619034.1 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110310162B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 张浩 | 申请(专利权)人: | 西安点告网络科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 宋朋飞 |
地址: | 710000 陕西省西安市高新区天谷八路1*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 生成 方法 装置 | ||
1.一种样本生成的方法,其特征在于,所述方法包括:
获取广告展示生成的至少三组历史日志数据,所述历史日志数据包括:曝光数据、点击数据以及转化数据;
根据所述曝光数据、点击数据以及转化数据分别确定每两组历史日志数据间的相对样本关系;
所述根据所述曝光数据、点击数据以及转化数据确定每两组历史日志数据间的相对样本关系,包括:依次按照转化数据、点击数据以及曝光数据的顺序分别确定每两组历史日志数据间的相对样本关系;或者,根据每组历史日志数据的特征值来确定每两组历史日志数据间的相对样本关系,所述特征值为每组历史数据中的曝光数据、点击数据以及转化数据之和;
根据所述每两组历史日志数据间的相对样本关系生成正负样本集。
2.根据权利要求1所述的方法,其特征在于,所述根据所述曝光数据、点击数据以及转化数据分别确定每两组历史日志数据间的相对样本关系,包括:
依次按照转化数据、点击数据以及曝光数据的顺序分别确定每两组历史日志数据中各组历史日志数据的虚拟点击值;
根据所述各组历史日志数据的虚拟点击值确定每两组历史日志数据间的相对样本关系。
3.根据权利要求2所述的方法,其特征在于,根据所述每两组历史日志数据间的相对样本关系生成正负样本集,包括:
对所述每两组历史日志数据间的相对样本关系进行聚合得到每组历史日志数据的聚合值,所述聚合值包括曝光数据之和以及虚拟点击值之和;
根据所述每组历史日志数据的聚合值生成正负样本集。
4.一种广告转化率预估的方法,其特征在于,所述方法包括;
通过权利要求1-3任一项所述的方法生成正负样本集;
根据所述正负样本集训练转化率预估模型;
根据训练后的转化率预估模型预估待投放广告的转化率。
5.一种样本生成的装置,其特征在于,所述装置包括:
获取模块,被配置为用于获取广告展示生成的至少三组历史日志数据,所述历史日志数据包括曝光数据、点击数据以及转化数据;
确定模块,被配置为用于根据所述曝光数据、点击数据以及转化数据分别确定每两组历史日志数据间的相对样本关系;
所述确定模块,具体被配置为:依次按照转化数据、点击数据以及曝光数据的顺序分别确定每两组历史日志数据间的相对样本关系;或者,根据每组历史日志数据的特征值来确定每两组历史日志数据间的相对样本关系,所述特征值为每组历史数据中的曝光数据、点击数据以及转化数据之和;
生成模块,被配置为用于根据所述每两组历史日志数据间的相对样本关系生成正负样本集。
6.一种广告转化率预估的装置,其特征在于,所述装置包括;
生成模块,被配置为用于通过权利要求5所述的装置生成正负样本集;
训练模块,被配置为用于根据所述正负样本集训练转化率预估模型;
预估模块,被配置为用于根据训练后的转化率预估模型预估待投放广告的转化率。
7.一种电子设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1-4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安点告网络科技有限公司,未经西安点告网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910619034.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:特征聚合的方法及装置
- 下一篇:一种精准制定营销策略的方法、设备及可读介质