[发明专利]一种混合值属性审批数据的分类方法及系统在审
申请号: | 201910014482.9 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109740680A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 贾晋;何玉林 | 申请(专利权)人: | 深圳中创华安科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06Q40/02 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
地址: | 518000 广东省深圳市龙华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 属性数据 数据集 审批 分类 热编码 编码数据 神经网络 数值属性 不确定性 分类结果 实际输出 数据包括 损失函数 最小化 集合 融合 输出 转换 | ||
1.一种混合值属性审批数据的分类方法,其特征在于,包括:
获取待分类的混合值属性的审批数据;所述审批数据包括离散值属性数据集和连续值属性数据集;
采用独热编码方法对所述离散值属性数据集进行转换,得到独热编码数据集;
基于神经网络对所述独热编码数据集进行深度编码,得到深度编码数据集;
将所述深度编码数据集和所述连续值属性数据集合并,得到实数值属性数据集;
采用连续值属性数据的分类方法对所述实数值属性数据集进行分类,得到所述审批数据的分类结果。
2.根据权利要求1所述的混合值属性审批数据的分类方法,其特征在于,所述待分类的混合值属性的审批数据为信用卡审批数据。
3.根据权利要求1所述的混合值属性审批数据的分类方法,其特征在于,所述采用独热编码方法对所述离散值属性数据集进行转换,得到独热编码数据集,具体包括:
利用公式将所述离散值属性数据集中的第n个样本的第m2个离散值属性对应的数据值进行转换;其中,为离散值属性数据集中第n个样本的第m2个离散值属性对应的数据值,为离散值属性数据集中第n个样本的第m2个离散值属性对应的数据值转换后的第k个数据值,离散值属性数据集中所有样本的第m2个离散值属性对应的数据值集合为表示所述离散值属性数据集中所有样本的第m2个离散值属性的取值的个数,为数据值集合中的第k个元素,表示所述离散值属性数据集中离散值属性的个数,代表审批数据中样本的个数;
依次得到所述离散值属性数据集中每一个样本的每一个离散值属性对应的数据值转换后的数据值,进而得到独热编码数据集。
4.根据权利要求1所述的混合值属性审批数据的分类方法,其特征在于,所述基于神经网络对所述独热编码数据集进行深度编码,得到深度编码数据集,具体包括:
获取编码神经网络;所述编码神经网络包括多个隐含层;
将所述独热编码数据集输入所述编码神经网络;所述编码神经网络的输入层节点的个数为表示所述离散值属性数据集中离散值属性的个数,表示所述离散值属性数据集中所有样本的第m2个离散值属性的取值的个数,所述编码神经网络的损失函数为其中,λ为增强因子,λ>0;为深度编码数据集的实际输出与真实输出之间的误差,为的不确定性;为所述编码神经网络隐含层的输出矩阵,为所述编码神经网络隐含层的个数;所述编码神经网络隐含层的输出矩阵使得所述损失函数最小化;
根据所述编码神经网络隐含层的输出矩阵的数值,确定所述深度编码数据集。
5.根据权利要求4所述的混合值属性审批数据的分类方法,其特征在于,所述连续值属性数据的分类方法包括支持向量机和神经网络。
6.一种混合值属性审批数据的分类系统,其特征在于,包括:
审批数据获取模块,用于获取待分类的混合值属性的审批数据;所述审批数据包括离散值属性数据集和连续值属性数据集;
独热编码转换模块,用于采用独热编码方法对所述离散值属性数据集进行转换,得到独热编码数据集;
深度编码模块,用于基于神经网络对所述独热编码数据集进行深度编码,得到深度编码数据集;
合并模块,用于将所述深度编码数据集和所述连续值属性数据集合并,得到实数值属性数据集;
分类模块,用于采用连续值属性数据的分类方法对所述实数值属性数据集进行分类,得到所述审批数据的分类结果。
7.根据权利要求6所述的混合值属性审批数据的分类系统,其特征在于,所述待分类的混合值属性的审批数据为信用卡审批数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中创华安科技有限公司,未经深圳中创华安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910014482.9/1.html,转载请声明来源钻瓜专利网。