[发明专利]一种基于层级化聚类的金融新闻流突发检测方法有效
申请号: | 202110734921.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113449108B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 周沧琦;陈辉;王慧慧;杨帆;王毓祥 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/194;G06F40/242;G06F40/289;G06K9/62;G06Q40/00 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210094 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层级 化聚类 金融 新闻 突发 检测 方法 | ||
一种基于层级化聚类的金融新闻流突发检测方法,包括:文本的预处理;抽取关键词并构建关键词共现图;采用二分K‑Means算法对关键词聚类,将关键词共现图划分为若干子图,每个子图中的关键词为一个金融主题;通过相似度计算识别每篇金融新闻所属金融主题;构建以每篇金融新闻为节点的无向图,采用二分K‑Means算法对金融新闻聚类,将金融新闻节点无向图划分为若干子图,每个子图中的金融新闻为一个金融事件;通过相似度计算生成故事链;突发事件检测。本发明通过自然语言处理及图论相关技术,对金融新闻进行事件聚类,解决了传统金融突发事件不能将同一事件相关新闻综合考虑的问题,实现了高效准确地检测出金融突发事件,具有一定的工业价值。
技术领域
本发明涉及金融新闻数据挖掘领域,尤其是一种基于层级化聚类的金融新闻流突发检测方法。
背景技术
投资者是金融市场的重要参与者,一旦爆发金融突发事件,将殃及广大投资者。对于金融突发事件的检测,有助于帮助投资者规避风险。
近年来,金融行业相关的舆情呈现“浪涌”态势,出现时间相对集中、信息交互 量大,交互次数频繁。金融舆情的产生、扩大和传播对投资者、金融机构、金融业乃 至宏观经济运行都会产生重要影响,往往一些小的信用危机,则有可能酿成金融危机 事件,因此,对金融舆情进行监测与应对可以把握预期管理的节奏,减少和避免金融 舆情危机的爆发。金融行业目前应对突发事件存在以下问题:
1.危机意识薄弱,金融突发事件监控力度不够;
2.金融突发事件应对体系不够完善;
3.金融突发事件发生时网络舆论的引导和处置不够专业。
这些问题也是由于现行对于金融突发事件的监控方法所导致的,当前的方法以专业人 员梳理新闻脉络根据潜在规律分析为主。专业人员通常会通过观察宏观、中观(行业)、 微观(企业)的新闻事件再根据过去的经验辅助推断可能会发生某个类似的金融突发事件。宏观新闻主要包括以下几种:
1.国际政治军事的大事件。有可能造成国际局势动荡的大事件,都会造成避险资产(黄 金、白银、美元、日元、瑞士法郎)的升值,风险资产(尤以股票为甚)的下跌。相 反,当国际局势趋于明朗安定的时候,避险资产会下跌,市场风险偏好会增加。
2.国内财政政策。一般减税、大型基建计划推出时会利好股市。
3.国内货币政策。降准、公开市场操作、调整再贴现利率、信贷政策等也会对债市、股市、汇市产生影响。
4.定期发布的宏观经济数据。具体而言,有PPI(生产者物价指数),CPI(消费者物价指数),GDP,PMI,美国非农就业人数等。
5.国际经贸协定。
中观的行业新闻包括以下几种:
1.产业政策。例如,医保政策限定药品采购价,医药股大跌。
2.产业自身及其上下游重大技术进展,特别是可能改变行业竞争格局的技术进展。
3.个别的突发新闻。
微观(企业个体、某类商品)新闻主要包括以下几种:
1.大宗商品供需;
2.公司财务报表发布;
3.公司新产品销售状况;
4.公司自身重大风险事件;
5.股东减持、解禁等;
6.公司并购与重组等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110734921.0/2.html,转载请声明来源钻瓜专利网。