[发明专利]一种用户画像方法、装置、可读存储介质及终端设备在审
| 申请号: | 201910041702.7 | 申请日: | 2019-01-16 |
| 公开(公告)号: | CN109886299A | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 刘嘉;赵付利 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类器 特征向量 画像 特征信息 终端设备 维度 预设 计算机可读存储介质 标签 计算机技术领域 可读存储介质 标签向量 训练过程 耦合 关联性 准确率 遍历 传递 评估 | ||
1.一种用户画像方法,其特征在于,包括:
获取用户在预设的各个评估维度上的特征信息,并根据所述特征信息构造所述用户的特征向量;
将所述用户的特征向量输入到预设的分类器序列中进行处理,得到所述用户的标签向量,其中,所述分类器序列中包括两个以上的不同分类器,且各个分类器的排列顺序通过在训练过程中对各种排列顺序进行遍历确定,所述标签向量包括两个以上的标签维度上的标签值,每个分类器用于确定一个标签维度上的标签值。
2.根据权利要求1所述的用户画像方法,其特征在于,所述分类器序列的构造过程包括:
从预设的历史用户信息数据库中选取N个训练样本,并组成训练样本集合,N为正整数;
将预设的分类器集合中的各个分类器的各种排列顺序进行遍历,使用所述训练样本集合分别对各种排列顺序的分类器进行训练,并分别计算各种排列顺序的分类精准度;
从各种排列顺序中选取分类精准度最高的一种排列顺序作为优选路径,并按照所述优选路径构造所述分类器序列。
3.根据权利要求2所述的用户画像方法,其特征在于,所述训练样本集合中的每个训练样本均包括一个历史用户的特征向量和标签向量,即:
Samplen=(EigenVecn,LabelVecn)
其中,Samplen为所述训练样本集合中的第n个训练样本,1≤n≤N,EigenVecn为第n个训练样本的特征向量,且:
EigenVecn=(EigenValn,1,EigenValn,2,...,EigenValn,en,...,EigenValn,EN),
EigenValn,en为第n个训练样本的特征向量在第en个评估维度上的特征信息,1≤en≤EN,EN为评估维度的总数,LabelVecn为第n个训练样本的标签向量,且:LabelVecn=(LabelValn,1,LabelValn,2,...,LabelValn,ln,...,LabelValn,LN),LabelValn,ln为第n个训练样本的标签向量在第ln个标签维度上的标签值,1≤ln≤LN。
4.根据权利要求3所述的用户画像方法,其特征在于,使用所述训练样本集合分别对第CandiSq种排列顺序的分类器进行训练的过程包括:
根据下式对所述训练样本集合的各个训练样本的特征向量进行扩展:
ExEigenVecCandiSq,ln,n=(ExEigenVecCandiSq,ln-1,n,SelLabelValCandiSq,ln-1,n)
其中,ExEigenVecCandiSq,ln,n为第n个训练样本在对第CandiSq种排列顺序中的第ln个分类器的训练过程中扩展得到的特征向量,1≤CandiSq≤LN!,LN!为LN的阶乘,特殊地,设置ExEigenVecCandiSq,0,n=EigenVecn,SelLabelValCandiSq,ln,n为第n个训练样本与第CandiSq种排列顺序中的第ln个分类器对应的标签值,特殊地,设置
使用所述训练样本集合分别对各个分类器进行训练,其中,分类器的输入为所述训练样本集合中各个训练样本扩展得到的特征向量,输出为预测标签值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041702.7/1.html,转载请声明来源钻瓜专利网。





