[发明专利]基于三支决策理论进行特征交互选择的点击率预估模型在审
申请号: | 202110622654.8 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113327131A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 谢珺;赵旭栋;续欣莹;李小飞 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 太原市科瑞达专利代理有限公司 14101 | 代理人: | 王思俊 |
地址: | 030024 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策 理论 进行 特征 交互 选择 点击率 预估 模型 | ||
1.基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于包括下述步骤:
S1、数据预处理:对于显式反馈直接用点击情况进行标注;对于隐式反馈,采用阈值法进行标注,即反馈分数超过某一阈值即标注为点击,阈值根据不同数据的评分范围来划分;最后将分类特征利用One-hot编码和Embedding转换为向量;
S2、交互特征:即采用因子分解机及其衍生模型的方式对向量化的分类特征进行交互,得到交互特征;
S3、选择交互特征:即利用三支决策理论结合Sigmoid函数提出的三支决策门函数对交互特征进行选择,剔除冗余的交互特征,保留重要的交互特征;
S4、输出结果:利用选择后的交互特征和原始特征,交互特征是经过三支决策门选择后的特征,最后经过逻辑斯蒂回归函数得到最后的点击概率。
2.根据权利要求1所述的基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,包括了原始数据处理模块,因子分解机及其衍生模型产生交互特征模块及三支决策门选择交互特征模块,以及最后的预测结果模块;能够区别重要的交互特征信息,剔除冗余交互特征,降低了模型的训练时间,为在线广告平台及推荐系统中点击率预估任务提供新的思路。
3.根据权利要求2所述的一种基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,所述的原始数据包括广告信息,受众信息以及上下文信息,数据量较大,为亿级。
4.根据权利要求2所述的一种基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,区分显式反馈与隐式反馈数据,利用One-hot编码将原始分类特征转换为稀疏向量,利用Embedding技术将稀疏矩阵映射为地位的稠密向量。
5.根据权利要求2所述的一种基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,交互特征的产生主要利用因子分解机及其衍生模型,因子分解机及其衍生模型采用特殊的内积方法进行特征交互。
6.根据权利要求5所述的一种基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,三支决策门函数是基于三支决策理论和Sigmoid函数提出的一种选择交互特征的函数;交互特征经过因子分解机及其衍生模型选择之后,可以输入至三支决策门函数进行选择,得到经过筛选的比较重要的交互特征。
7.根据权利要求6所述的一种基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,构造三支决策门的步骤如下:
步骤1:确定三支决策门的超参数α和β;
步骤2:利用阈值α和β将二分类Sigmoid函数划分为正域POS(X),负域NEG(X)以及边界域BND(X);Sigmoid(x)>α时,x∈POS(X);当βSigmoid(x)≤α时,x∈BND(X);当Sigmoid(x)≤β时,x∈NEG(X);
步骤3:对不同域的结果进行划分,当x∈POS(X)时,三支决策门函数当x∈BND(X)时,当x∈NEG(X),
上述步骤中x为交互特征向量,为三支决策门函数。
8.根据权利要求1所述的一种基于三支决策理论进行交互特征选择的点击率预估模型,其特征在于,模型的评价标准包括模型损失函数Logloss和AUC(ROC曲线下的面积),Logloss的优化方法为Adam;
其中为yj标签的实际值,为预测值,N为整个样本的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110622654.8/1.html,转载请声明来源钻瓜专利网。