[发明专利]基于半监督学习的交易成本预测方法在审
| 申请号: | 202010235246.2 | 申请日: | 2020-03-30 |
| 公开(公告)号: | CN111461422A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 李晓东;吴庞敬 | 申请(专利权)人: | 河海大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06N20/00 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 汤金燕 |
| 地址: | 210000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 监督 学习 交易成本 预测 方法 | ||
本发明公开了一种上述基于半监督学习的交易成本预测方法,对通过实盘交易获得的真实交易订单数据、由证券交易模拟器输出的模拟交易订单数据、以及待执行交易订单数据分别进行预处理,将预处理后的模拟交易订单数据和待执行交易订单数据合并为无交易成本标记的无标记订单数据,将预处理后的真实交易订单数据确定为有交易成本标记的有标记订单数据,根据有标记订单数据和无标记订单数据建立带权无向完全图,在带权无向完全图中,从有标记订单数据向无标记订单数据传播,以实现无标记订单数据的交易成本预测,其可以降低证券交易订单交易成本预测的成本开销,提高证券交易订单的交易成本预测准确性。
技术领域
本发明涉及计算机信息技术领域,尤其涉及一种基于半监督学习的交易成本预测方法。
背景技术
近年来,随着金融工程的发展,越来越多的证券投资机构开始使用机器学习模型对投资进行指导。然而,在证券投资机构在分析订单交易成本过程中,证券投资机构需要证券交易订单的交易数据分析订单的交易成本。由于证券交易订单的交易数据涉及企业机密和用户隐私,证券投资机构只能将订单投入实际市场进行交易,需要大量资金投入且存在风险,因此获取真实证券交易订单的交易数据成本高。证券交易模拟器能产生大量模拟订单数据,但此类订单的交易成本为模拟估计、缺少真实值,无法预知证券交易订单与证券交易市场间的相互作用,特别是大额订单,对交易市场冲击大且无法准确计算。
由于半监督学习可同时学习标记数据和无标记数据,可使用无标记数据提升监督学习的学习效果,在近十多年受到了大量的关注。早期的半监督学习主要探索无标记样本在传统监督学习模型中的价值。Dempster等人在监督学习中利用无标记样本来提高分类器性能,提出基于生成模型理论的半监督学习模型及用于求解模型的EM算法。Vapnik基于“决策面应与有标记和无标记样本保持最大间隔”的思想提出了半监督支持向量机,在早期的半监督学习模型中具有较大的影响。相继有研究基于半正定规划、凹凸过程、延续法、确定性退火等方法提出半监督支持向量机的求解过程。之后,Blum和Chawla从学习视图的角度提出了协同训练模型。但半监督支持向量机是非凸的优化问题,协同训练模型对数据要求苛刻,在实际应用中存在困难。为使半监督学习更加直观、易用,一系列基于图的半监督学习模型,如最小切割,局部和全局一致性,标记传播等相继被提出。基于图的半监督学习模型首先构建一个图结构,由有标记和无标记样本共同构成图的节点集,并根据样本间的相似性度量构成图的边集,然后把分类问题看作是类别信息在图上由有标记节点向无标记节点的扩散或传播过程。与早期方法相比,多数基于图的半监督学习模型为凸优化问题,易求得全局最优解。同时,模型基于矩阵运算操作,效率较高且便于理解和实现。
关于证券交易订单的交易成本,普遍的观点认为是由买卖价差引发的,由于交易市场中卖出和买入时间上和数量上的不匹配导致交易难以达成,从而产生买卖价差。早期的研究主要关注交易成本的构成分解,认为买卖价差主要是由指令处理成本、存货成本和信息成本等三方面产生。Roll认为市场是有效的且无摩擦的,交易成本单纯地由指令处理成本产生,可用证券市场上价格变化来表示,通过股票价格收益的一阶序列协方差取相反数的算术平方根计算交易成本。可见,上述传统的成本预测方案在达到一定准确度时往往存在成本高的问题。
发明内容
针对以上问题,本发明提出一种基于半监督学习的交易成本预测方法。
为实现本发明的目的,提供一种基于半监督学习的交易成本预测方法,包括如下步骤:
S10,对通过实盘交易获得的真实交易订单数据、由证券交易模拟器输出的模拟交易订单数据、以及待执行交易订单数据分别进行预处理;
S20,将预处理后的模拟交易订单数据和待执行交易订单数据合并为无交易成本标记的无标记订单数据,将预处理后的真实交易订单数据确定为有交易成本标记的有标记订单数据;
S30,根据有标记订单数据和无标记订单数据建立带权无向完全图G=(V,E),其中带权无向完全图中的节点vi∈V用于表征第i个订单数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010235246.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





