[发明专利]通过决策树模型对用户进行分类的方法、装置和设备在审

专利信息
申请号: 202110728460.6 申请日: 2021-06-29
公开(公告)号: CN113379301A 公开(公告)日: 2021-09-10
发明(设计)人: 梁炀潇 申请(专利权)人: 未鲲(上海)科技服务有限公司
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q40/04;G06K9/62
代理公司: 深圳市精英专利事务所 44242 代理人: 李翔宇
地址: 200000 上海市浦东新区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通过 决策树 模型 用户 进行 分类 方法 装置 设备
【权利要求书】:

1.一种通过决策树模型对用户进行分类的方法,其特征在于,所述方法包括:

获取待分类用户的至少一个用户属性以及预先创建的决策树模型;

获取当前场景下与所述决策树模型的各属性节点相对应的基尼系数,至少一个所述属性节点的基尼系数携带有与所述当前场景相对应的属性节点的权重信息;

从所述决策树模型的根节点开始,根据所述基尼系数依次确定下一层级属性节点的开支节点;

从所述用户属性中选取存在于所述决策树模型的属性节点中的用户属性,得到匹配属性;

将得到的所述匹配属性与所述决策树模型中的各节点属性进行匹配,根据所述决策树模型中确定的每一层级的开支节点,对所述用户进行分类。

2.根据权利要求1所述的通过决策树模型对用户进行分类的方法,其特征在于,所述获取待分类用户的至少一个用户属性以及预先创建的决策树模型之前,还包括:

获取当前场景以及当前场景中的用户样本,所述用户样本携带有正标签或负标签的标识;

获取正标签用户样本的样本特征以及所述样本特征所属的样本属性;

计算各所述样本属性的基尼系数;

将所述基尼系数最小的样本属性作为当前层级的开支节点;

在确定所述开支节点后,循环计算各剩余样本属性的基尼系数至所述将所述基尼系数最小的样本属性作为当前层级的开支节点的步骤,直到满足预设的停止条件,得到创建好的决策树模型。

3.根据权利要求2所述的通过决策树模型对用户进行分类的方法,其特征在于,通过以下公式计算各所述样本属性的基尼系数:

其中,Ni表示样本特征A所属的样本属性,D表示所述正标签用户样本,ti表示根据当前场景预先设置的对应样本属性的权重,|D|表示所述用户样本的总数量,|Dk|表示第k个所述样本属性中正标签用户样本的样本数量,|Ck|表示第k个所述样本属性的样本数量。

4.根据权利要求3所述的通过决策树模型对用户进行分类的方法,其特征在于,当所述样本属性对分类结果的影响力不受所述当前场景的影响时,将根据当前场景预先设置的对应样本属性的权重ti设置为1。

5.根据权利要求1所述的通过决策树模型对用户进行分类的方法,其特征在于,所述根据所述基尼系数依次确定下一层级属性节点的开支节点的步骤,包括:

获取在当前场景下的同一层级中各个属性节点相对应的基尼系数;

将获取到的所述基尼系数最小的属性节点作为当前层级往下一层级的开支节点。

6.根据权利要求2所述的通过决策树模型对用户进行分类的方法,其特征在于,所述将得到的所述匹配属性与所述决策树模型中的各节点属性进行匹配,根据所述决策树模型中确定的每一层级的开支节点,对所述用户进行分类的步骤包括:

从所述匹配属性中筛选与所述决策树模型的根节点相对应的匹配属性,得到第一剩余匹配属性;

从所述第一剩余的匹配属性中依次筛选与所述决策树模型的开支节点相对应的匹配属性,得到最终剩余匹配属性;

判断所述决策树模型的最后一个层级的叶子节点中是否包含有所述最终剩余匹配属性,若是,则将所述待分类用户与所述正标签用户样本分为同一类。

7.根据权利要求6所述的通过决策树模型对用户进行分类的方法,其特征在于,当所述决策树模型的最后一个层级的叶子节点中不包含所述最终剩余匹配属性时,所述方法还包括:

获取所述决策树模型的总层级数;

获取所述匹配属性配到的最后一个节点属性所在的层级数;

将所述最后一个节点属性所在的层级数与所述总层级数的比值的百分比作为所述待分类用户与所述正标签用户样本为同一类的概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110728460.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top