[发明专利]基于大数据的金融事件发现方法在审
申请号: | 201910873995.5 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110750622A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 石若琪;任炯铭;蒋雨肖;吴鹏 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06Q10/06;G06Q40/04 |
代理公司: | 32203 南京理工大学专利中心 | 代理人: | 马鲁晋 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 金融 财务指标 新闻文本 推理 预处理 应用范围广 评论数据 实例数据 事件发现 算法判断 大数据 时效性 构建 更新 学习 | ||
1.一种基于大数据的金融事件发现方法,其特征在于,包括以下步骤:
步骤1、根据特定事件的股民评论数据,获取舆情指标;
步骤2、利用protégé软件构建金融本体,所述金融本体包括财务指标类、非财务指标类、金融事件类、舆情指标类、股价类;
步骤3、将金融本体中每一个类的实例数据输入至金融本体中进行推理,获得特定事件对应的企业的股价变动趋势;金融本体类的实例数据中舆情指标具体采用步骤1获得的舆情指标;
步骤4、从网络中爬取特定事件的新闻文本数据,对该新闻文本数据进行预处理,并求取预处理后新闻文本数据的词频-逆文件频率tf-idf值,根据tf-idf值从新闻文本数据中提取热点词;
步骤5、根据所述推理获得的特定事件对应的企业的股价变动趋势、热点词以及金融本体的金融事件类,判断所述特定事件是否为金融事件,以及若为金融事件,并判断该金融事件的类别。
2.根据权利要求1所述的基于大数据的金融事件发现方法,其特征在于,步骤1所述根据特定事件的股民评论数据,获取舆情指标具体为:
步骤1-1、对特定事件的股民评论数据进行预处理;所述预处理包括:对数据进行清洗,删除错误数据;进行分词以及去停用词处理;
步骤1-2、从网络中随机选取大量的网民评论数据以及新闻文本数据,利用Skip-gram模型训练所选取的数据,获得词向量模型;
步骤1-3、利用步骤1-2训练好的词向量模型将步骤1-1预处理后的股民评论数据表示为词向量形式;
步骤1-4、构建用于训练长短期记忆模型即LSTM模型的样本数据集,并根据该样本数据集对LSTM模型进行训练,之后根据网民评论包含的情感倾向对其进行人工情感标注;所述样本数据集包括从网络中随机选取的大量的网民评论数据以及新闻文本数据;所述情感倾向包括正面情感倾向、负面情感倾向以及中立情感倾向;
步骤1-5、利用步骤1-4训练好的LSTM模型对步骤1-3获得的词向量形式的股民评论数据进行分类,获得正面评论数据、负面评论数据以及中立评论数据;
步骤1-6、统计正面评论数据、负面评论数据以及中立评论数据各自的比例,根据这些比例结合舆情计算规则求取舆情指标,所用公式为:
舆情指标=[1*正面评论比例+0*中立评论比例+(-1)*负面评论比例]*100 (1)。
3.根据权利要求2所述的基于大数据的金融事件发现方法,其特征在于,步骤1-1所述错误数据包括乱码错误,内容中企业、时间与特定事件不相关的错误;
所述分词以及去停用词,具体为:根据金融领域词典、常用分词词典以及常用停用词词典,利用结巴分词进行分词以及去停用词处理。
4.根据权利要求1所述的基于大数据的金融事件发现方法,其特征在于,步骤2所述构建金融本体具体为:
步骤2-1、构建金融本体的层次结构,包括财务指标类、非财务指标类、金融事件类、舆情指标类、股价类;
步骤2-2、对步骤2-1中每一个类的数据属性和对象属性进行定义;
步骤2-3、对本体的规则进行定义,并将其转化为SWRL规则下的表达。
5.根据权利要求1或3所述的基于大数据的金融事件发现方法,其特征在于,步骤2-1所述财务指标类包括偿债能力子类、经营能力子类、盈利能力子类、现金流水平子类、风险水平子类、发展能力子类;所述非财务指标类包括债权人子类、员工子类、研发能力子类、运营情况子类;所述舆情指标类包括舆情得分子类,得分公式如式1所示;所述金融事件类包括个股因素子类、宏观因素子类、行业因素子类;所述股价类包括事件前五天股价描述子类、事件前十天股价描述子类、事件后股价升降子类、股价得分子类。
6.根据权利要求1所述的基于大数据的金融事件发现方法,其特征在于,步骤2-2所述每一个类的数据属性为RDF或RDFS的数据类型,对象属性为两个类的实例间的关系,两者均包括定义域Domain、值域Range和公理Axiom。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910873995.5/1.html,转载请声明来源钻瓜专利网。