[发明专利]一种基于机器学习算法的债券风险预测方法及系统在审
申请号: | 201710385291.4 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107248030A | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | 谢首鹏 | 申请(专利权)人: | 谢首鹏 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/06 |
代理公司: | 北京酷爱智慧知识产权代理有限公司11514 | 代理人: | 孟凡臣 |
地址: | 213000 江苏省常*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 算法 债券 风险 预测 方法 系统 | ||
技术领域
本发明属于大数据技术领域,具体涉及一种基于机器学习算法的债券风险预测方法及系统。
背景技术
金融市场的投资者,尤其商业银行、证券公司、保险机构、基金公司等,处于金融监管及风险控制的要求,有相当规模的资金用于购买固定收益类产品,债券是其中的重要投资标的。为了确保所投资的债券能带来稳定的利息收益,避免违约损失,投资人需要对其所投资的债券进行风险预警和跟踪预测,以买入优质的债券,并及时地卖出可能存在风险的债券。
现有的债券风险预警或预测技术的主要运用债券发行人与风险相关的信息,如征信信息、财务数据、第三方信用评级报告及研究报告等进行判断,但这些方法或技术往往具有滞后性,当发行人出现了相关的风险事件之后,才能被投资人获知。信用评级机构也是在债券发行主体发生风险事件后才采取相关的降级措施,而不少投资机构由于不具备提前预测风险的能力或者预测能力不足,往往可能面临巨大的债券违约风险。同时,目前由于金融市场的复杂性和相关金融技术的缺乏,极少有金融机构能够对债券风险做出精准的预测和准确的判断。
发明内容
针对现有技术中的缺陷,本发明提供亟需提供一种基于机器学习算法的债券风险预测方法及系统,能够对债券风险做出精准的预测和准确的判断,降低投资人的风险。
一种基于机器学习算法的债券风险预测方法,包括
获取步骤:获取并保存债券数据样本;
预处理步骤:运用统计学软件对债券数据样本进行预处理,得到预处理数据;
建模步骤:运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;
调参步骤:对所述建模步骤选出的模型进行调参和优化,得到最优模型;
预测步骤:实时获取债券数据,并采用所述最优模型对所述债券数据进行预测。
优选地,所述预处理步骤中预处理包括:
对债券数据样本进行去重处理,保留同单一发行主体数据;运用多重随机插补方法,对去重处理后的数据进行随机插补。
优选地,所述建模步骤中的机器学习算法包括逻辑回归、决策树、随机森林、支持向量机和神经网络中一种或几种组合。
优选地,所述调参步骤中调参和优化包括:
通过逐步调整风险厌恶水平,对所述建模步骤选出的模型进行迭代,找出使得灵敏度达到100%的最优风险厌恶水平,定义该厌恶水平对应的模型为所述最优模型。
优选地,所述调参步骤之后、预测步骤之前还包括:
检验步骤:运用蒙特卡洛模拟中的自助法,设定置信水平,对所述最优模型预测效果的稳定性进行检验。
优选地,所述预测步骤还包括:
采用所述最优模型对所述债券数据进行预测,将所述最优模型输出的概率值转化为风险值和风险标识,同时将所述风险值和风险标识返回至数据库;所述风险标识包括红、黄、绿3种,其中红、黄、绿对应的风险值逐渐减小。
优选地,还包括:
查询步骤:获取所述预测步骤对所述债券数据的预测结果,并与其对应发行的债券进行匹配;还根据输入的发行人名称或债券名称,查询对应发行人或债券的风险值和风险标识。
优选地,所述查询步骤之后还包括:
跟踪步骤:实时更新所述发行人或债券的风险值和风险标识,并对所述发行人或债券的风险值和风险标识进行实时跟踪。
基于机器学习算法的债券风险预测系统,运行上述基于机器学习算法的债券风险预测方法;包括:金融资讯终端、数据库、服务器和用户终端;
所述金融资讯终端上存储有各个发行人的债券数据;
所述服务器上设有获取单元、预处理单元、建模单元、调参单元、和预测单元:
所述获取单元用于从金融资讯终端获取并保存债券数据样本;
所述预处理单元用于运用统计学软件对债券数据样本进行预处理,得到预处理数据;
所述建模单元用于运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;
所述调参单元用于对所述建模单元选出的模型进行调参和优化,得到最优模型;
所述预测单元用于实时获取债券数据,并采用所述最优模型对所述债券数据进行预测,并将预测结果发送给数据库;
所述数据库用于保存所述预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谢首鹏,未经谢首鹏许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710385291.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理