[发明专利]一种基于数据挖掘的企业融资基金匹配方法在审
申请号: | 202111609332.6 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114266492A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 崔光裕;张帆;张志明;杨宝华;崔乐乐 | 申请(专利权)人: | 天元大数据信用管理有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/06;G06F16/215;G06F16/2458;G06F16/25;G06F16/28 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 挖掘 企业 融资 基金 匹配 方法 | ||
1.一种基于数据挖掘的企业融资基金匹配方法,其特征在于,
包括如下步骤:
S1:企业征信数据标准化:依据企业名称采集目标企业的征信信息,将海量征信信息数据进行融合,标准化处理;
S2:企业征信数据指标化:对企业征信数据进行指标化处理,根据RFM和无监督聚类算法对指标进行衍生和筛选,确立初步的指标库。
S3:企业画像构建与计算:构建通过企业画像描述企业特征的维度体系,并通过维度权重计算形成企业画像标签;
S4:企业画像标签展示与检索:企业画像标签的展示包括单个企业画像与标签展示和企业群画像与标签展示;企业画像标签检索支持金融机构通过画像标签筛选的方式检索符合要求的潜在投资对象;
S5:企业画像标签内容维护:画像系统根据企业发展数据的变化不断更新企业特征;采用滑动窗过滤算法,周期性地更新企业画像系统。
2.根据权利要求1所述的方法,其特征在于,
企业征信数据标准化,其数据处理步骤包含:
(1)征信数据的获取
完成数据仓库模型建设、数据源的定义、数据抽取、转换清洗及加载(ETL)工作;具体步骤包括:
数据源的定义:将接口数据、库表数据、非结构化数据统一管理和加工成便于存储、管理和使用的统一结构化数据;通过交叉比对、规则校验把结构不统一、数据信息不完整的数据源变成符合统一结构标准的,放到数据仓库中;
数据抽取、转换清洗及加载:在数据抽取、转换清洗及加载(ETL)的过程中,根据本次建模中征信数据系统的特点建立ETL策略,包括征信数据抽取频率、征信数据颗粒度、征信数据维度;
ETL结束后,对于整个过程的监控及跟踪处理也是必不可少的步骤。
其中,在数据抽取阶段,针对接口形式的数据采用触发器更新的方式;库表形式的数据中,针对每年、每月更新一次的数据,采用全量更新的方式;针对实时更新、每日更新、每周更新的数据,采用基于数据时间戳的增量抽取机制;在数据转换阶段,将上述过程抽取的原始企业征信数据转换为以时间、地域、行业等不同的数据维度,进而运用相关规则进行数据质量校验,排除不符合分析质量要求的数据;
(2)征信数据的治理
将取自一个以上数据源系统的详细数据,以及用于分析的集成汇总数据都存储在中心数据库;它在逻辑上是一个完整的库;从层次上来看,征信数据管理分为源数据层、校验数据层、基础数据层、产品数据层4个层次:
源数据层:是其它各层的数据的基础,源数据层将来源于各个数据源的数据进行统一规范化加工与存储,并运用适当的策略进行更新;
校验数据层:当源数据层数据到达后,通过既定的数据校验规则和校验流程对数据内容进行校验,通过校验的数据加载到中心数据库中,未通过校验的数据返回到下一层,错误的数据形成数据反馈报文反馈给与其对应的数据源的管理机构;
基础数据层:主要存储的是通过校验的关键征信业务数据;中心数据库主要是存储校验通过的数据,并将通过事后校验查出的错误数据退回到下一层,并最终形成错误反馈报文反馈给上报机构;
产品数据层:基础数据入库和整理完毕后,按照服务产品的种类、既定的数据抽取逻辑和挖掘分析加载到产品数据层,为用户准备好服务所需要的产品数据。(3)征信数据的应用
建立企业征信数据库,在其基础上进行数据治理、建模模型后,所提供的信用产品主要就是企业整体画像展示、企业标签及企业画像标签检索;企业画像标签检索将基于企业画像生成的企业标签结果通过No-sql的数据形式存在于数据库中,支持高速缓存,适用于对企业画像数据的快速查询,其输出的记过能够被能够通过Web页面进行展示,用于基金公司的获客分析与投资决策。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天元大数据信用管理有限公司,未经天元大数据信用管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111609332.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置