[发明专利]一种基于数据类型进行建模的方法和装置在审
申请号: | 202310204578.8 | 申请日: | 2023-03-03 |
公开(公告)号: | CN116226741A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 周晓瑞;卓正兴;杨青 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214 |
代理公司: | 北京启坤知识产权代理有限公司 11655 | 代理人: | 李琛 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据类型 进行 建模 方法 装置 | ||
本发明的目的是提供一种基于数据类型进行建模的方法和装置。所述方法包括:通过对用户的征信报告进行解析,得到相应的征信数据;将所述征信数据按照预定的多个数据类型进行分类;基于分类后的对应于不同数据类型的征信数据,构建和训练神经网络模型,其中,该模型包括多个分别适用于不同数据类型的子模型。本申请实施例具有以下优点:通过将征信数据按照预定的多个数据类型进行分类,并对征信报告各个字段下的各项数据按照预定的多个数据类型进行建模,降低了征信报告变量管理的复杂度;如果需要进行后续模型的迭代升级,只需修改对应数据类型的神经网络结构即可对所有的同一类型数据生效。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于数据类型进行建模的方法和装置。
背景技术
基于现有技术的方案,对于征信报告的深度学习建模一般需要单独解析并建模每种征信报告信息。然而,该方式存在以下缺陷:1)大量数据分别解析和建模容易产生疏漏而导致建模出错;2)对每个字段分别解析而产生的大量冗余代码不利于后续模型的迭代和升级。
以人行出具的征信报告为例,征信报告包含超过15个字段共计超过130种信息,对每种信息单独设计网络结构会产生大量的重复工作,因为需要管理的字段多,对任意一种信息的解析和网络设计出错都会导致建模出错,因此容易产生错误和疏漏。并且,由于每种信息的网络结构相互独立,如果后续的模型迭代和升级中某个改进点需要修改多处信息的处理方式,需要对涉及到的每个网络结构进行相应地修改,这个过程同样容易产生错误和疏漏,而且产生了大量的重复工作。
发明内容
本发明的目的是提供一种基于数据类型进行建模的方法和装置。
根据本申请的实施例,提供了一种基于数据类型进行建模的方法,其中,所述方法包括:
通过对用户的征信报告进行解析,得到相应的征信数据;
将所述征信数据按照预定的多个数据类型进行分类;
基于分类后的对应于不同数据类型的征信数据,构建和训练神经网络模型,其中,该模型包括多个分别适用于不同数据类型的子模型。
根据本申请的实施例,提供了一种基于数据类型进行建模的装置,其中,所述装置包括:
用于通过对用户的征信报告进行解析,得到相应的征信数据的装置;
用于将所述征信数据按照预定的多个数据类型进行分类的装置;
用于基于分类后的对应于不同数据类型的征信数据,构建和训练神经网络模型的装置,其中,该模型包括多个分别适用于不同数据类型的子模型。
根据本申请的实施例,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现本申请实施例的方法。
根据本申请的实施例,提供了一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本申请实施例的方法。
与现有技术相比,本申请实施例具有以下优点:通过将征信数据按照预定的多个数据类型进行分类,并对征信报告各个字段下的各项数据按照预定的多个数据类型进行建模,降低了征信报告变量管理的复杂度;如果需要进行后续模型的迭代升级,只需修改对应数据类型的神经网络结构即可对所有的同一类型数据生效,无需针对每个字段下的各项数据一一进行修改,大幅降低了征信报告深度学习模型的开发和维护工作量和容错度,提升了效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出了根据本申请实施例的用于基于数据类型进行建模的方法流程图;
图2示出了根据本申请实施例的示例性的征信报告的解析结果示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310204578.8/2.html,转载请声明来源钻瓜专利网。