[发明专利]一种基于互联网数据采集的情绪指数构建方法在审
| 申请号: | 201611030961.2 | 申请日: | 2016-11-16 |
| 公开(公告)号: | CN106780036A | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | 都科 | 申请(专利权)人: | 硕橙(厦门)科技有限公司 |
| 主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 361000 福建省厦门市集美*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 互联网 数据 采集 情绪 指数 构建 方法 | ||
技术领域
本发明属于数据分析技术领域,特别涉及一种关于股票价格预测的情绪指数构建方法。
背景技术
近年来,金融学界大量学术研究发现非标准化的数据,例如通过特殊方法构建的投资者关于市场的情绪波动指数、关于监管层面政策不确定性的相关指数,以及投资者在网络上发表的关于投资的正负面言论等,对于解释和分析金融市场波动起到了关键性的作用。因此,区别于目前通用的例如股票开盘价、收盘价、交易量等标准化金融数据,可通过构建市场投资者的情绪指数,来对股票价格日常走势进行预测。
发明内容
本发明的目的,在于提供一种基于互联网数据采集的情绪指数构建方法,其可通过IT技术获取市场投资者的情绪指数,对金融市场中的投资决策提供重要的附加信息。
为了达成上述目的,本发明的解决方案是:
一种基于互联网数据采集的情绪指数构建方法,包括如下步骤:
步骤1,获取互联网数据中针对某项投资的关注程度;
步骤2,构建正负情绪指标;
步骤3,从公开市场获取当月IPO数量和当日股票价格波动两项指标;
步骤4,根据如下公式计算市场投资者情绪指数:
市场投资者情绪指数=[A/(A+B+C+D)]*关注程度(Focus)+[B/(A+B+C+D)]*正负情绪指标(PosNegSentiment)+[C/(A+B+C+D)]*当月IPO数量(IPOnum)+[D/(A+B+C+D)]*当日股票价格波动(Volatility)
其中,A,B,C,D分别为关注程度、正负情绪指标、当月IPO数量、当日股票价格波动的权重。
上述步骤1的详细内容是:根据上市公司总部所在地对应的IP所发表的关键字进行检索,针对某项投资,以固定时间段为单位收集相关指数,来作为关注程度,所述相关指数是指在固定时间段内关键字出现次数的总和。
上述固定时间段为每月、每周、每天、每小时或每分钟。
上述步骤2的详细内容是:
步骤21,采用ORACLE关系型数据库,包括表guba,表authors,表articles和表comments,通过如下步骤构建数据库:
1)发送HTTP请求至股吧主页URL,获取HTML内容并解析,记录page=1;
2)查找新标签,遍历子节点;
i.将帖子的标题、作者、股吧账号、发表日期、最后更新日期存入表articles;
ii.访问帖子URL,获取细览页HTML内容并解析,将内容、阅读数、评论数存入表comments;
iii.访问作者URL,获取作者页HTML内容并解析,将作者信息存入表authors;
iv.访问帖子股吧URL,将股吧信息存入表guba;
3)获取帖子总数和每页帖子数,判断当前是否为最后一页,如果不是最后一页,则访问下一页,记录page=page+1,重复步骤2);
步骤22,基于网页得到的语义数据,通过语义分析领域通用的中文情感极性词词典使用SOSA算法进行分析,SOSA算法持续多次随机轮询节点,并根据以上方式进行状态改变;然后,逐渐将温度下降,重复下一轮操作;
步骤23,当轮询次数达到预设,或满足停止准则时,结束重复过程,以当前结果作为正负情绪指标。
上述步骤4中,权重的计算方法是:查询股票实时收益,同时将步骤1-3得到的关注程度、正负情绪指标、当月IPO数量、当日股票价格波动代入下式,
股票实时收益=A*关注程度+B*正负情绪指标+C*当月IPO数量+D*当日股票价格波动+残差
假设残差符合正态分布,应用多元线性回归得出A,B,C,D的值。
采用上述方案后,本发明利用非标准化数据对金融领域的影响,将非标准的网络情绪数据和标准的金融数据有机结合,构成一套非标准化的、能够准确衡量市场投机情绪的指数,基金经理,风控经理以及广大投资者可以依据此信息调整投资策略,规避市场风险。
具体实施方式
以下将结合具体实施例,对本发明的技术方案及有益效果进行详细说明。
本发明提供一种基于互联网数据采集的情绪指数构建方法,可通过设计相应的指数,通过IT技术从网络上合法获取计算该指数所需要的相关信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于硕橙(厦门)科技有限公司,未经硕橙(厦门)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611030961.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:单边账规模控制方法及系统
- 下一篇:提示方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





