[发明专利]一种通过将连续特征离散化预测程序TAD的控制方法及装置有效

专利信息
申请号: 202110628404.5 申请日: 2021-06-07
公开(公告)号: CN113254501B 公开(公告)日: 2021-11-16
发明(设计)人: 战思南;沈振雷 申请(专利权)人: 上海二三四五网络科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06N3/04;G06N3/08;G06Q10/04;G06Q30/02
代理公司: 上海唯源专利代理有限公司 31229 代理人: 曾耀先
地址: 200137 上海市浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通过 连续 特征 离散 预测 程序 tad 控制 方法 装置
【说明书】:

发明提供了一种通过将连续特征离散化预测程序TAD的控制方法,包括如下步骤:a.获取程序的连续特征信息以及离散特征信息;b.基于Embedding模型将离散特征信息转换为离散特征信息向量化表示;c.基于软离散化层将连续特征信息软离散化为软离散化特征信息向量化表示;d.将离散特征信息向量化表示以及软离散化特征信息向量化表示输入至MLP神经网络中训练,并将输出结果作为程序TAD的预测结果,软离散化层通过如下公式确定:,h(x)为软离散化特征信息向量化表示,x为所述连续特征信息,w、b为参数。本发明使用方便,功能强大,实用性强,适应面广,克服了现有技术中无法实现连续特征软离散化的技术弊端,具有极高的商业价值。

技术领域

本发明属于程序开发技术领域,具体地,涉及一种通过将连续特征离散化预测程序TAD的控制方法及装置。

背景技术

每个用户的总活跃天数指标(Total Active Days per User),即为TAD,一个具有普适性的移动产品价值衡量标准,以帮助移动创业者了解并专注于那些真正重要的点,即让app的用户长久地留下来,在现有的技术中,通过采用连续特征预测程序的TAD。在渠道质量评估中,我们需要预估渠道的平均生命周期TAD,我们会有大量统计类连续特征,这些特征直接做归一化输入深度模型效果不太好,因为很多特征都呈非线性分布。通常的做法是将这些连续特征进行手动离散化,但是手动离散化依赖经验,而且不容易合理切分。

在深度学习中,我们常用的特征数据有两种,一种是离散特征,一种是连续特征,对于离散特征的处理,深度学习中通常采用embedding的方式,而对于连续特征,通常会进行归一化处理,然后直接输入到模型进行计算,如果连续特征分布存在较强的非线性(大多情况下是这样),通常的深度学习模型学习起来会非常困难。目前工业界常用的方式是将这一类特征提起根据经验进行离散化,比如一天的时间,划分成凌晨,上午,下午,晚上。再比如连续的年龄划分为未成年,青年,中年,老年等等。

现有的这些划分需要十分熟悉业务特点和数据分布,依赖专家经验,而且在分割边界的数据会存在一定的困惑度,比如,17岁算未成年,18岁就算青年了。然而生理上和个人特质上并没有如此大的变化,模型却出现了严重的分散,这也给模型学习带来了很大的困难。

而目前,市场上并没有一种能够有效解决上述问题的具体办法,尤其涉及一种通过将连续特征离散化预测程序TAD的控制方法及装置。

发明内容

针对现有技术存在的技术缺陷,本发明的目的是提供一种通过将连续特征离散化预测程序TAD的控制方法及装置,根据本发明的一个方面,提供了一种通过将连续特征离散化预测程序TAD的控制方法,包括如下步骤:

a.获取所述程序的连续特征信息以及离散特征信息;

b.基于Embedding模型将所述离散特征信息转换为离散特征信息向量化表示;

c.基于软离散化层将所述连续特征信息软离散化为软离散化特征信息向量化表示;

d.将所述离散特征信息向量化表示以及所述软离散化特征信息向量化表示输入至MLP神经网络中训练,并将输出结果作为程序TAD的预测结果,其中,

所述软离散化层通过如下公式确定:

,其中,所述h(x)为软离散化特征信息向量化表示,所述x为所述连续特征信息,所述w、b为参数。

优选地,所述连续特征信息至少包括平均单价和/或平均点击次数和/或留存率和/或平均使用时间和/或平均启动次数。

优选地,所述离散特征信息至少包括渠道类型和/或渠道付费类型和/或付费状态。

优选地,在所述步骤a之前,还包括步骤:

i:获取在一个或多个连续特征信息的条件下的实际TAD;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海二三四五网络科技有限公司,未经上海二三四五网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110628404.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top