[发明专利]一种基于时间序列智能预测的企业异动预警方法有效
| 申请号: | 201811582052.9 | 申请日: | 2018-12-24 |
| 公开(公告)号: | CN109740044B | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 蒋昌俊;王鹏伟;章昭辉;张翔 | 申请(专利权)人: | 东华大学 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/35 |
| 代理公司: | 上海泰能知识产权代理事务所(普通合伙) 31233 | 代理人: | 宋缨;钱文斌 |
| 地址: | 201620 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 时间 序列 智能 预测 企业 预警 方法 | ||
1.一种基于时间序列智能预测的企业异动预警方法,其特征在于,包括以下步骤:
(1)使用网络爬虫技术获取网络新闻文本以及新闻的发布时间,并进行数据预处理;
(2)将数据转化为时间序列,并划分为时间序列段,用来进行时间序列预测;
(3)使用时间序列智能预测模型进行时间序列预测;
(4)通过文本聚类进行预警信息的挖掘,找到簇的中心文本作为预警新闻;具体包括以下子步骤:
(41)提取文本的关键词和关键句;具体包括:
(411)对新闻分句中的每个词语,提取文本的关键词;
(412)计算每个词与10个关键词的余弦相似度并取最大值作为词语重要程度评分;
(413)将分句中所有词语的重要程度评分累加取平均值作为句子的重要程度评分;
(414)提取重要程度评分最高的5个句子共同作为新闻关键句群;
(42)将文本的关键句转化为词向量矩阵;
(43)使用PCA降维,根据降维后的特征,采用TF-IDF方式计算每一篇文档中每一个词的权重;
(44)把余弦相似度最大的两个文本合并成一个簇,进入下一次余弦相似度计算之中,直到达到停止条件;
(45)提取文本簇中心文本,将其作为预警新闻。
2.根据权利要求1所述的基于时间序列智能预测的企业异动预警方法,其特征在于,所述步骤(1)中的数据预处理包括去除无用数据、去除重复数据、去除文本与企业名不符数据、统一文本发布时间格式和统一企业名称。
3.根据权利要求1所述的基于时间序列智能预测的企业异动预警方法,其特征在于,所述步骤(2)包括以下子步骤:
(21)将新闻按照不同企业和发布时间统计为每个企业每个月的新闻量;
(22)按照滑动窗口的方法划分数据集,并将训练集数据顺序随机化;
(23)将每个数据段进行归一化,预测结束需要反归一化。
4.根据权利要求1所述的基于时间序列智能预测的企业异动预警方法,其特征在于,所述步骤(3)包括以下子步骤:
(31)构建网络模型结构,确定网络基本参数,激活函数、舍弃率、误差的计算方式、参数迭代更新的方式、迭代次数和批处理大小;
(32)调整模型参数权值,通过迭代优化模型各隐藏层参数;
(33)使用测试数据进行预测,得到近期一年的预测数据;
(34)用预测数据和测试数据的最后一个标签即实际数据做相关性分析。
5.根据权利要求4所述的基于时间序列智能预测的企业异动预警方法,其特征在于,所述步骤(34)中使用相关性分析的协方差来评估实际新闻量数据是否和理论预测值相关,若两者相关系数为负,且绝对值大于实际新闻量的平均值,则认为两者差距过大,即实际新闻量数据有异常,企业异动。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811582052.9/1.html,转载请声明来源钻瓜专利网。





