[发明专利]基于深度自动编码器降维结合GBDT的营销预测方法有效
申请号: | 202011606919.7 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112633937B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 项亮;潘信法 | 申请(专利权)人: | 上海数鸣人工智能科技有限公司 |
主分类号: | G06Q30/0251 | 分类号: | G06Q30/0251;G06Q30/0241;G06F18/243;G06F18/2135;G06F18/2136;G06N3/0455;G06N3/0895 |
代理公司: | 上海天辰知识产权代理事务所(特殊普通合伙) 31275 | 代理人: | 陶金龙;尹一凡 |
地址: | 200436 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 自动 编码器 结合 gbdt 营销 预测 方法 | ||
一种基于深度自动编码器降维结合梯度提升决策树的营销预测方法,包括数据预处理步骤、数据集划分步骤、特征降维步骤、模型建立步骤、对营销活动点击的预测步骤;其通过使用深度自动编码器对从运营商处获得的用户访问DPI这一稀疏特征进行自监督非线性降维,再使用降维后的原始特征结合用户的其他特征如用户访问DPI频次和归属地等一起投入GBDT中进行建模,以期解决特征维度过高和过于稀疏对GBDT模型泛化能力及建模的内存需求的影响。因此,本发明在减少特征维度的同时,尽量减少原始特征所包含信息的损失,达到了可以对所收集的数据进行全面分析的目的。
技术领域
本发明涉及人工智能在互联网营销的技术领域,更具体地,涉及一种基于深度自动编码器降维结合梯度提升决策树的营销预测方法。
背景技术
随着经济全球化和市场经济的迅速发展,在企业营销战略中广告营销活动发挥着越来越重要的作用,是企业营销组合中的一个重要组成部分。网络广告营销是借助网络营销能最大化的传播给受众人群,而且也更为精准,网络广告营销需要广告主借助网络平台投入广告给目标性客户。
梯度提升决策树是一种利用用户画像和用户行为特征来进行对广告营销行为预测的常用建模方法,但是在使用运营商数据的实际建模过程中,有如下几个问题经常会对模型的预测能力以及处理能力带来挑战:
①、从运营商初获取的用户画像和用户行为数据往往都是十分稀疏的0/1二值特征,以GBDT为代表的决策树模型在既有类别特征又有连续特征的时候,会倾向于选择连续特征作为分裂点,这将导致原有的类别特征的信息并不能被有效利用,从而造成特征浪费且影响模型的泛化能力;
②、用户的行为数据如dpi的访问作为特征时,其特征维度往往非常高,再加上庞大的用户数量,这给模型训练需要的内存空间提出了很大的要求;
③、用户画像数据和行为数据并不总是和广告点击相关,特征中存在部分冗余。因此,原始特征维度应该存在一个合理的低维特征表示。
以上几点表明,一个合理的特征处理方式是将高维的稀疏特征降维为低维的稠密特征之后,再使用GBDT进行建模。因此,降维方式是提高预测能力以及处理能力的关键。然而,传统的降维方式主要为主成分分析(PCA),本领域技术人员清楚,PCA的降维是线性的且利用方差信息进行降维,对高维的稀疏特征并不是很适用。
发明内容
本发明的目的在于克服现有技术存在的上述缺陷,提供一种基于深度自动编码器降维结合梯度提升决策树的营销预测方法,其使用深度自动编码器对从运营商处获得的DPI访问这一稀疏特征进行自监督非线性降维,再使用降维后的特征结合用户的其他特征如用户访问DPI频次和归属地等一起投入GBDT中进行建模,以期解决特征维度过高和过于稀疏对GBDT模型泛化能力及建模的内存需求的影响。
为实现上述目的,本发明的技术方案如下:
一种基于深度自动编码器降维结合梯度提升决策树的营销预测方法,其特征在于,包括数据预处理步骤S1、数据集划分步骤S2、特征降维步骤S3和模型建立步骤S4;
所述数据预处理步骤S1包括如下步骤:
步骤S11:获取用户的原始信息,并从所述用户的原始信息提取原始特征信息;其中,所述原始特征信息包括用户ID、用户手机号码归属地、任务批次号、用户访问DPI、用户访问DPI频次;其中,所述任务批次号表示一个日期时间段中用户的原始信息,所述用户访问DPI、用户访问DPI频次为每一个任务批次号为计量单位,所述用户访问DPI和用户的手机号码归属地特征为类别特征;
步骤S12:对类别特征进行处理;即对所述用户手机号码归属地特征和用户访问DPI进行One-hot编码处理;其中,所述One-hot编码处理包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数鸣人工智能科技有限公司,未经上海数鸣人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011606919.7/2.html,转载请声明来源钻瓜专利网。