[发明专利]通过决策树模型对用户进行分类的方法、装置和设备在审
| 申请号: | 202110728460.6 | 申请日: | 2021-06-29 |
| 公开(公告)号: | CN113379301A | 公开(公告)日: | 2021-09-10 |
| 发明(设计)人: | 梁炀潇 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/04;G06K9/62 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
| 地址: | 200000 上海市浦东新区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 决策树 模型 用户 进行 分类 方法 装置 设备 | ||
1.一种通过决策树模型对用户进行分类的方法,其特征在于,所述方法包括:
获取待分类用户的至少一个用户属性以及预先创建的决策树模型;
获取当前场景下与所述决策树模型的各属性节点相对应的基尼系数,至少一个所述属性节点的基尼系数携带有与所述当前场景相对应的属性节点的权重信息;
从所述决策树模型的根节点开始,根据所述基尼系数依次确定下一层级属性节点的开支节点;
从所述用户属性中选取存在于所述决策树模型的属性节点中的用户属性,得到匹配属性;
将得到的所述匹配属性与所述决策树模型中的各节点属性进行匹配,根据所述决策树模型中确定的每一层级的开支节点,对所述用户进行分类。
2.根据权利要求1所述的通过决策树模型对用户进行分类的方法,其特征在于,所述获取待分类用户的至少一个用户属性以及预先创建的决策树模型之前,还包括:
获取当前场景以及当前场景中的用户样本,所述用户样本携带有正标签或负标签的标识;
获取正标签用户样本的样本特征以及所述样本特征所属的样本属性;
计算各所述样本属性的基尼系数;
将所述基尼系数最小的样本属性作为当前层级的开支节点;
在确定所述开支节点后,循环计算各剩余样本属性的基尼系数至所述将所述基尼系数最小的样本属性作为当前层级的开支节点的步骤,直到满足预设的停止条件,得到创建好的决策树模型。
3.根据权利要求2所述的通过决策树模型对用户进行分类的方法,其特征在于,通过以下公式计算各所述样本属性的基尼系数:
其中,Ni表示样本特征A所属的样本属性,D表示所述正标签用户样本,ti表示根据当前场景预先设置的对应样本属性的权重,|D|表示所述用户样本的总数量,|Dk|表示第k个所述样本属性中正标签用户样本的样本数量,|Ck|表示第k个所述样本属性的样本数量。
4.根据权利要求3所述的通过决策树模型对用户进行分类的方法,其特征在于,当所述样本属性对分类结果的影响力不受所述当前场景的影响时,将根据当前场景预先设置的对应样本属性的权重ti设置为1。
5.根据权利要求1所述的通过决策树模型对用户进行分类的方法,其特征在于,所述根据所述基尼系数依次确定下一层级属性节点的开支节点的步骤,包括:
获取在当前场景下的同一层级中各个属性节点相对应的基尼系数;
将获取到的所述基尼系数最小的属性节点作为当前层级往下一层级的开支节点。
6.根据权利要求2所述的通过决策树模型对用户进行分类的方法,其特征在于,所述将得到的所述匹配属性与所述决策树模型中的各节点属性进行匹配,根据所述决策树模型中确定的每一层级的开支节点,对所述用户进行分类的步骤包括:
从所述匹配属性中筛选与所述决策树模型的根节点相对应的匹配属性,得到第一剩余匹配属性;
从所述第一剩余的匹配属性中依次筛选与所述决策树模型的开支节点相对应的匹配属性,得到最终剩余匹配属性;
判断所述决策树模型的最后一个层级的叶子节点中是否包含有所述最终剩余匹配属性,若是,则将所述待分类用户与所述正标签用户样本分为同一类。
7.根据权利要求6所述的通过决策树模型对用户进行分类的方法,其特征在于,当所述决策树模型的最后一个层级的叶子节点中不包含所述最终剩余匹配属性时,所述方法还包括:
获取所述决策树模型的总层级数;
获取所述匹配属性配到的最后一个节点属性所在的层级数;
将所述最后一个节点属性所在的层级数与所述总层级数的比值的百分比作为所述待分类用户与所述正标签用户样本为同一类的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110728460.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于全柔性软管的消防装置
- 下一篇:一种年糕成型封装一体机及年糕切断装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





