[发明专利]特征衍生方法、装置及计算机设备在审
申请号: | 201911108450.1 | 申请日: | 2019-11-13 |
公开(公告)号: | CN111046912A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 阮怀玉;章鹏;杨志雄 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 衍生 方法 装置 计算机 设备 | ||
1.一种特征衍生方法,所述方法包括:
从预先训练的决策树模型的至少一条路径上提取若干个节点对应的特征;
根据所述特征生成特征集合,其中,不同路径上提取的特征对应不同的特征集合;
根据所述特征集合进行特征衍生,以得到衍生特征。
2.根据权利要求1所述的特征衍生方法,所述特征集合中的各个元素分别为一个节点对应的特征;或
所述特征集合中的各个元素均包括一个节点对应的特征以及所述特征对应的特征阈值。
3.根据权利要求2所述的特征衍生方法,基于所述特征集合进行特征衍生,以得到衍生特征之前,还包括:
对元素相同的特征集合进行合并。
4.根据权利要求3所述的特征衍生方法,若所述特征集合的各个元素均包括一个节点对应的特征以及所述特征对应的特征阈值,对元素相同的特征集合进行合并之前,还包括:
对所述特征阈值进行离散化处理。
5.根据权利要求4所述的特征衍生方法,对所述特征阈值进行离散化处理,包括:
将所述节点对应的特征的取值范围划分成若干个区间,每个区间对应一个量化值;
确定所述特征阈值最接近的区间,并用所述最接近的区间对应的量化值更新所述特征阈值。
6.根据权利要求1-5任一项所述的特征衍生方法,基于所述特征集合进行特征衍生,以得到衍生特征,包括:
根据各个特征集合中不同元素构成的组合出现的频次提取目标组合;
根据所述目标组合中的各元素进行特征衍生,以得到衍生特征。
7.根据权利要求6所述的特征衍生方法,若所述特征集合的每个元素为一个节点对应的特征以及所述特征对应的特征阈值,则根据各个特征集合中不同元素构成的组合出现的频次提取目标组合之前,还包括:
将所述特征集合转换为新特征集合,所述新特征集合中的各元素仅包括节点对应的特征。
8.根据权利要求6所述的特征衍生方法,根据各个特征集合中不同元素构成的组合出现的频次提取目标组合,包括:
将元素个数满足第一预设条件以及所述频次满足第二预设条件的组合作为所述目标组合。
9.根据权利要求8所述的特征衍生方法,则所述第一预设条件包括:
若所述组合中的各个元素为一个节点对应的特征,则所述组合中元素个数大于1,小于3;或
若所述组合中的各个元素包括一个节点对应的特征以及所述特征对应的特征阈值,则所述组合中元素个数大于1,小于4。
10.根据权利要求8所述的特征衍生方法,所述第二预设条件包括:
所述组合出现的频次大于预设阈值。
11.根据权利要求6所述的特征衍生方法,根据所述目标组合中的各元素进行特征衍生,以得到衍生特征,包括:
确定所述目标组合的元素的类型;
根据所述元素的类型对所述目标组合中的元素进行衍生,以得到衍生特征。
12.根据权利要求1所述的特征衍生方法,所述方法还包括:
对原始特征进行组合,得到一个或多个目标特征;
根据所述原始特征、目标特征以及所述原始特征的标签训练所述决策树模型。
13.一种特征衍生装置,所述装置包括:
提取模块,用于从预先训练的决策树模型的至少一条路径上提取若干个节点对应的特征;
特征集合生成模块,用于根据所述特征生成特征集合,其中,不同路径上提取的特征对应不同的特征集合;
特征衍生模块,用于根据所述特征集合进行特征衍生,以得到衍生特征。
14.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至12任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911108450.1/1.html,转载请声明来源钻瓜专利网。