[发明专利]一种用户的分类方法及装置在审
| 申请号: | 201910948666.2 | 申请日: | 2019-10-08 |
| 公开(公告)号: | CN110717787A | 公开(公告)日: | 2020-01-21 |
| 发明(设计)人: | 张茂洪 | 申请(专利权)人: | 恩亿科(北京)数据科技有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
| 代理公司: | 11646 北京超成律师事务所 | 代理人: | 刘静 |
| 地址: | 100000 北京市海淀区西小口路66*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类用户 属性特征 样本 待选用户 特征矩阵 用户分群 用户属性 分类 房屋价格 用户分类 用户特征 分群 楼层 筛选 房屋 居住 申请 | ||
1.一种用户的分类方法,其特征在于,包括:
获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值;所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种;
基于各个样本待分类用户的待选用户属性特征下的特征值,对所述待选用户属性特征进行筛选,从所述待选用户属性特征中,确定至少一个选定用户属性特征;
基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值,构成用于表征各个样本待分类用户属性特征的特征矩阵;
基于各个样本待分类用户的特征矩阵,训练得到用户分群模型;
基于预先训练的用户分群模型中,对待分类用户进行分群。
2.根据权利要求1所述的方法,其特征在于,所述基于各个样本待分类用户的待选用户属性特征下的特征值,对所述待选用户属性特征进行筛选,包括:
针对每种待选用户属性特征,基于各个所述样本待分类用户分别在该待选用户属性特征下的特征值,得到该待选用户属性特征对应的标准差;将该待选用户属性特征对应的标准差与预设标准差阈值进行比对;
若该待选用户属性特征对应的标准差大于所述预设标准差预阈值,则将该待选用户属性特征确定为选定用户属性特征。
3.根据权利要求1所述的方法,其特征在于,基于各个所述样本待分类用户的在各个选定用户特征下的特征值,构成用于表征各个样本待分类用户属性特征的特征矩阵,包括:
针对在所有选定用户特征下均不存在特征值确实的样本待分类用户,基于该样本待分类用户在各个选定用户特征下均不存在特征值,构成该样本待分类用户的特征矩阵;
针对在任一选定用户特征下存在特征值缺失的样本待分类用户,基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值,对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充,得到该样本待分类用户在该任一选定用户特征下的填充值;
基于该样本待分类用户在该任一选定用户特征下的填充值,以及该样本待分类用户在其他未存在缺失的选定用户特征下的特征值,构成该样本待分类用户的特征矩阵。
4.根据权利要求3所述的方法,其特征在于,基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值,对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充,包括:
确定除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值的平均数或众数,基于确定的所述平均数或者众数,对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充。
5.根据权利要求1所述的方法,其特征在于,所述用户分群模型包括:岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型;
基于各个样本待分类用户的特征矩阵,训练得到用户分群模型,包括:
针对每个样本待分类用户,将该样本待分类用户的特征矩阵依次输入至岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型,得到与岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型分别对应的中间预测分类结果;
基于岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型分别对应的中间预测分类结果,得到与该样本待分类用户对应的预测分类结果;
基于各个样本待分类用户分别对应的实际分类结果,以及预测分类结果,对岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型进行本轮训练,并训练岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型分别对应的权重;
对岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型进行多轮训练,得到用户分群模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恩亿科(北京)数据科技有限公司,未经恩亿科(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910948666.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种权益发放的方法和系统
- 下一篇:一种目标用户的筛选方法及装置





