[发明专利]一种基于社会网络聚类的股票指数跟踪预测方法及系统在审
申请号: | 201710100466.2 | 申请日: | 2017-02-23 |
公开(公告)号: | CN106897797A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 刘海飞;许金涛 | 申请(专利权)人: | 南京大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 朱小兵 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社会 网络 股票 指数 跟踪 预测 方法 系统 | ||
1.一种基于社会网络聚类的股票指数跟踪预测方法,其特征在于,包括以下步骤:
(1)、从第三方数据库中采集上月和当月的指数以及成份股数据,并对数据进行清洗,得到能用于研究的样本内数据和样本外数据;所述样本内数据为指数及其成份股上月的前复权1分钟收盘价数据,所述样本外数据为指数及其成份股当月的前复权1分钟收盘价数据;
(2)、根据样本内数据构建训练模型,对成份股采用社会网络聚类模型构建股票池,并用指数跟踪优化模型确定最优权重;
(3)、将样本内训练得到的股票池和最优权重运用于样本外数据的指数跟踪,得到预测的指数。
2.根据权利要求1所述的基于社会网络聚类的股票指数跟踪预测方法,其特征在于,在步骤(1)中,对所有收盘价数据进行数据清洗,包括:剔除缺失严重的股票、删除第一天和最后一天停市或数据缺失的股票、删除所有股票和指数及期货缺失超过一半的时刻、对缺失数据进行线性插值补全、再次对首末存在缺失的时刻进行删除,最终得到研究的样本内、样本外数据。
3.根据权利要求1所述的基于社会网络聚类的股票指数跟踪预测方法,其特征在于,在步骤(2)中,是从成份股中提取相关性低且具有代表性的股票构建股票池,具体流程包括:用成份股间的相关系数计算度量距离,构建成份股间的社会网络,用自适应仿射传播聚类算法对网络进行聚类,提取每簇的聚类中心形成股票池。
4.根据权利要求1所述的基于社会网络聚类的股票指数跟踪预测方法,其特征在于,在步骤(2)中,所述指数跟踪优化模型是通过最优化模型实现股票池股票对标的指数的最优跟踪,具体为:用股票池股票的线性组合得到跟踪指数,以跟踪指数与标的指数的跟踪误差最小为目标,进行二次优化模型求解股票的最优线性组合,确定最优权重。
5.根据权利要求3所述的基于社会网络聚类的股票指数跟踪预测方法,其特征在于,在步骤(2)中,用成份股间的相关系数计算度量距离,构建成份股间的社会网络,用自适应仿射传播聚类算法对网络进行聚类,提取每簇的聚类中心形成股票池,具体如下:
A、计算研究样本的对数收益率ri(t),ri(t)=lnpi(t)-lnpi(t-1),得到指数以及成份股的对数收益率序列;其中,pi(t)表示第i只成分股在第t时间的前复权收盘价;
B、基于对数收益率序列,计算任意两只股票i和j在观测时间内股价波动的线性相关系数ρij,其中E(ri)表示第i只股票在样本内的平均对数收益率,t1表示样本内总交易天数;
C、根据任意两只股票间的相关系数构建相应的相关系数矩阵C,其中C为对角线为1的对称矩阵;
D、将相关系数ρij转化为对应的度量距离dij,将相关系数矩阵C转化为距离矩阵D,以距离矩阵D表示任意两只股票间的度量距离,得到成份股间的社会网络,其中D为对角线为0的对称矩阵;
E、对成份股间的社会网络进行自适应仿射传播AAP聚类,通过不断调整偏向参数值确定一系列包含不同簇的聚类结果,并提取每一组聚类结果的每簇的聚类中心分别构建股票池。
6.根据权利要求5所述的基于社会网络聚类的股票指数跟踪预测方法,其特征在于,在步骤(2)中,针对每组聚类结果,通过二次指数跟踪优化模型确定最优权重,并引入跟踪误差TE度量指数跟踪效果的好坏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710100466.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理