[发明专利]一种基于时间序列智能预测的企业异动预警方法有效
申请号: | 201811582052.9 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109740044B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 蒋昌俊;王鹏伟;章昭辉;张翔 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/35 |
代理公司: | 上海泰能知识产权代理事务所(普通合伙) 31233 | 代理人: | 宋缨;钱文斌 |
地址: | 201620 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时间 序列 智能 预测 企业 预警 方法 | ||
本发明涉及一种基于时间序列智能预测的企业异动预警方法,包括以下步骤:使用网络爬虫技术获取网络新闻文本以及新闻的发布时间,并进行数据预处理;将数据转化为时间序列,并划分为时间序列段,用来进行时间序列预测;使用时间序列智能预测模型进行时间序列预测;通过文本聚类进行预警信息的挖掘,找到簇的中心文本作为预警新闻。本发明能够通过外部公开的数据解决企业异动预警问题。
技术领域
本发明涉及企业异动预警技术领域,特别是涉及一种基于时间序列智能预测的企业异动预警方法。
背景技术
在企业的逐渐发展过程中,自身的运营与外界媒体的报道已经密不可分,越来越多的企业事件都是由媒体向各方面展示,并且通过潜移默化地影响着人们的看法甚至企业的走势。由于目前媒体的报道可以反映出社会各方面对该企业的认知,所以可以通过网络舆情进行企业预警方面的研究。企业异动预警正是在这种形势下产生的,旨在通过对网络信息进行分析,挖掘网络信息对于企业异动的反映,从而对企业异动实现预警,希望有助于监管部门及时发现企业问题,针对企业提出相应措施。
目前主流的企业异动预警是针对企业的内部数据,即财务报表、纳税金额等等,但是这些数据对于公司外部人员和相关监管人员是难以获取的。因此亟需一种通过外部公开数据实现对企业异动预警的方法。
发明内容
本发明所要解决的技术问题是提供一种基于时间序列智能预测的企业异动预警方法,能够通过外部公开的数据解决企业异动预警问题。
本发明解决其技术问题所采用的技术方案是:提供一种基于时间序列智能预测的企业异动预警方法,包括以下步骤:
(1)使用网络爬虫技术获取网络新闻文本以及新闻的发布时间,并进行数据预处理;
(2)将数据转化为时间序列,并划分为时间序列段,用来进行时间序列预测;
(3)使用时间序列智能预测模型进行时间序列预测;
(4)通过文本聚类进行预警信息的挖掘,找到簇的中心文本作为预警新闻。
所述步骤(1)中的数据预处理包括去除无用数据、去除重复数据、去除文本与企业名不符数据、统一文本发布时间格式和统一企业名称。
所述步骤(2)包括以下子步骤:
(21)将新闻按照不同企业和发布时间统计为每个企业每个月的新闻量;
(22)按照滑动窗口的方法划分数据集,并将训练集数据顺序随机化;
(23)将每个数据段进行归一化,预测结束需要反归一化。
所述步骤(3)包括以下子步骤:
(31)构建网络模型结构,确定网络基本参数,激活函数、舍弃率、误差的计算方式、参数迭代更新的方式、迭代次数和批处理大小;
(32)调整模型参数权值,通过迭代优化模型各隐藏层参数;
(33)使用测试数据进行预测,得到近期一年的预测数据;
(34)用预测数据和测试数据的最后一个标签即实际数据做相关性分析。
所述步骤(34)中使用相关性分析的协方差来评估实际新闻量数据是否和理论预测值相关,若两者相关系数为负,且绝对值大于实际新闻量的平均值,则认为两者差距过大,即实际新闻量数据有异常,企业异动。
所述步骤(4)具体包括以下子步骤:
(41)提取文本的关键词和关键句;
(42)将文本的关键句转化为词向量矩阵;
(43)使用PCA降维,根据降维后的特征,采用TF-IDF方式计算每一篇文档中每一个词的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811582052.9/2.html,转载请声明来源钻瓜专利网。