[发明专利]基于支持向量机的新闻极性对股票价格变化趋势预测的方法在审
申请号: | 201910342420.0 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110222864A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 赵澄;童川;王万良 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06K9/62;G06F16/35 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 支持向量机模型 金融新闻 支持向量机 预测 变化趋势 股票价格 特征词 预设 预处理操作 标签标注 股票交易 交易数据 金融股票 新闻文本 向量化 嵌入 清洗 标准化 保存 股票 评估 检验 改进 | ||
基于支持向量机的新闻极性对股票价格变化趋势预测的方法,包括:从网上获取金融股票交易数据与相关股票的金融新闻数据;进行金融新闻数据的清洗,并对股票交易数据进行标准化、对金融新闻数据进行极性标签标注的预处理操作;使用卡方检验提取金融新闻中的特征词;利用特征词将新闻文本向量化,输入改进的嵌入支持向量机模型中进行模型的循环训练;对每次训练得到的支持向量机模型进行评估并保存评价最佳支持向量机模型;判断是否达到预设的预测精度,如果没有达到则继续上述操作,直到达到预设的预测精度以得到精确度最优的支持向量机模型。
技术领域
本发明涉及对股票价格变化趋势预测的方法。
技术背景
股票市场的预测可以帮助投资者进行投资决策,为他们提供关于股票市场行为的深刻见解以规避投资风险。然而,股票市场的预测并不是一件易事,因为股票市场数据的性质是可变的、非线性的、不稳定的、接近随机游走的;同时,影响股市的因素有很多,如经济状况、政治事件、新闻报道、投资者情绪等。按照传播学的议程设置理论,新闻媒体虽然不能直接决定人们对某一事件的具体看法和观点,但可以通过提供信息和调整议题来有效左右人们对一些事实和意见的关注次序,进而间接影响人的观点和决策。金融新闻对股票市场有很大的影响,投资者经常依赖金融新闻信息来决定买卖,即投资者根据市场参与者可获得的信息做出投资决策。行为金融学的最新研究发现,股票投资者的情绪冲动会影响股价。由于新闻报道给市场带来了与上市公司有关的新信息新的信息,其中包含关于一家公司的新闻、它所涉及的活动、它的基本面以及市场参与者对其未来价格变动的预期,这些信息会对股票投资者的情绪带来影响,从而影响投资者的决策,进一步改变市场状态,这使新闻报道成为金融预测的重要数据来源。如果新闻情绪是积极的,那么股价上涨的可能性就更大;如果新闻情绪是消极的,那么股价可能会下跌。
机器学习策略因具有较高的计算精度和较快的计算速度,已成为新兴的算法交易策略,被应用于新闻对股票影响的研究中。其中,支持向量机(SVM)方法被认为是最有前途的文本分类机器学习技术,首次引入于1979年,已被证明是一种用于数据分类、回归和预测的有用技术。SVM算法旨在学习一种决策函数,该函数将具有不同类标签的实例划分为不同的类。基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题求解问题(Quadratic Programming,QP)。它可以表示原始空间中的线性或非线性决策边界。
SVM在金融市场预测中具有广泛的适用性,但存在一些不足之处:1、训练过程都不存在迭代操作,属于“一次线性模型”,存在过拟合及无法找到最优解的风险。2、在特征提取时没有突出重要特征的作用。3、没有综合考虑高维输入参数和噪声数据对模型的影响。
发明内容
本发明要克服现有技术的上述缺点,提供基于支持向量机的新闻极性对股票价格变化趋势预测的方法。
本发明的基于支持向量机的新闻极性对股票价格变化趋势预测的方法,包括以下步骤:
1)、从网上获取金融股票交易数据与相关股票的金融新闻数据;
2)、进行金融新闻数据的清洗,并对股票交易数据进行标准化、对金融新闻数据进行极性标签标注的预处理操作;
3)、使用卡方检验提取金融新闻中的特征词;
4)、利用特征词将新闻文本向量化,输入改进的嵌入支持向量机模型中进行模型的循环训练;
5)、对每次训练得到的支持向量机模型进行评估并保存评价最佳支持向量机模型;
6)、判断是否达到预设的预测精度,如果没有达到则继续上述操作,直到达到预设的预测精度以得到精确度最优的支持向量机模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910342420.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理