[发明专利]一种基于数据类型进行建模的方法和装置在审
申请号: | 202310204578.8 | 申请日: | 2023-03-03 |
公开(公告)号: | CN116226741A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 周晓瑞;卓正兴;杨青 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214 |
代理公司: | 北京启坤知识产权代理有限公司 11655 | 代理人: | 李琛 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据类型 进行 建模 方法 装置 | ||
1.一种基于数据类型进行建模的方法,其中,所述方法包括:
通过对用户的征信报告进行解析,得到相应的征信数据;
将所述征信数据按照预定的多个数据类型进行分类;
基于分类后的对应于不同数据类型的征信数据,构建和训练神经网络模型,其中,该模型包括多个分别适用于不同数据类型的子模型。
2.根据权利要求1所述的方法,其中,所述通过将征信报告的多个字段信息按照数据类型进行分类,得到对应于不同数据类型的征信数据包括:
对于征信报告的每个字段,将该字段包含的各项数据按照预定的多个数据类型进行分类,得到对应于一个或多个数据类型的征信数据;
将属于同一数据类型的征信数据进行合并,从而将该字段包含的各项数据分类为对应于一个或多个数据类型的数据。
3.根据权利要求1或2所述的方法,其中,所述方法包括:
对于不能直接归类为某一数据类型的征信数据,基于预定的规则进行修改,使得修改后的征信数据被归类为预定的多个数据类型之一。
4.根据权利要求1所述的方法,其中,所述方法包括:
针对每个字段,基于该字段包含的对应于一个或多个数据类型的征信数据,分别实例化该一个或多个数据类型对应的神经网络结构;
将各个字段属于同一数据类型的征信数据进行聚合和编码处理,以基于处理后的数据进行模型训练。
5.根据权利要求1至4中任一项所述的方法,其中,所述多个预定的数据类型包括数值型、枚举型和文本型。
6.根据权利要求1至5中任一项所述的方法,其中,使用训练好的神经网络模型来进行风险预测。
7.一种基于数据类型进行建模的装置,其中,所述装置包括:
用于通过对用户的征信报告进行解析,得到相应的征信数据的装置;
用于将所述征信数据按照预定的多个数据类型进行分类的装置;
用于基于分类后的对应于不同数据类型的征信数据,构建和训练神经网络模型的装置,其中,该模型包括多个分别适用于不同数据类型的子模型。
8.根据权利要求7所述的装置,其中,所述用于通过将征信报告的多个字段信息按照数据类型进行分类,得到对应于不同数据类型的征信数据的装置用于:
对于征信报告的每个字段,将该字段包含的各项数据按照预定的多个数据类型进行分类,得到对应于一个或多个数据类型的征信数据;
将属于同一数据类型的征信数据进行合并,从而将该字段包含的各项数据分类为对应于一个或多个数据类型的数据。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一所述的方法。
10.一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310204578.8/1.html,转载请声明来源钻瓜专利网。