[发明专利]一种面向金融事件的混合型因果关系发现方法有效
申请号: | 201911193643.1 | 申请日: | 2019-11-28 |
公开(公告)号: | CN111026852B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 林海涛;蔡瑞初 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06Q40/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 金融 事件 混合 因果关系 发现 方法 | ||
本发明公开了一种面向金融事件的混合型因果关系发现方法,首先对文本事件因果关系进行抽取;然后结合文本事件所对应的关键词在百度指数上找出事件对应时间序列的关注指数的变化趋势,即搜索指数曲线,并运用传递熵进行时序事件因果关系的推断;最后用最大似然估计方法融合因果关系抽取结果和基于搜索指数曲线的时序数据进行因果关系推断所得的结果,生成一种因果关系发现。本发明方法可以对金融事件对所蕴含的因果关系进行快速的甄别与发现。
技术领域
本发明涉及金融事件的因果关系发现技术领域,尤其涉及一种面向金融事件的混合型因果关系发现方法。
背景技术
在经济全球化的时代背景下,研究金融事件因果关系对于制定国家的宏观调控政策具有重要的参考意义。比如开放自贸区带来的进出口总额的变化对外贸型企业股价存在一定的影响,这种影响可以提炼为金融政策的发布对以出口为导向的企业的发展存在因果关系,即金融政策调整导致企业股价上升。同时随着自然语言处理技术的快速发展,文本事件抽取和事件因果关系的抽取领域已经存在大量的研究基础,而现有研究中仍缺乏针对金融事件中因果关系的快速甄别和发现方法。
发明内容
本发明为解决金融事件中因果关系的无法快速甄别和发现的问题,提供了一种面向金融事件的混合型因果关系发现方法。
为实现以上发明目的,而采用的技术手段是:
一种面向金融事件的混合型因果关系发现方法,其特征在于,包括以下步骤:
S1.获取金融事件文本数据集;
S2.从所述金融事件文本数据集中抽取文本事件因果关系;
S3.从所述金融事件文本数据集中提取文本事件的关键词并利用百度指数上转化为随时间动态变化的搜索指数曲线;
S4.运用格兰杰因果性或因果传递熵算法确定两搜索指数曲线对应的文本事件对之间的因果关系;
S5.用最大似然估计方法融合步骤S2和S4分别得到的因果关系,从而生成金融事件因果关系发现。
优选的,步骤S2中所述从所述金融事件文本数据集中抽取文本事件因果关系通过以下的文本事件因果关系抽取架构实现:
输入层:利用Stanford Parser对所述金融事件文本数据集进行数据预处理,获取每个文本事件序列的句法标签和词性标签;
序列预测层:构建融合注意力机制的Bi-LSTM-CRF网络并输入所述文本事件序列的句法标签和词性标签进行预训练,获得每个文本事件序列的双向隐状态编码信息和文本事件的标签信息,作为关系预测层的联合输入;
关系预测层:构建融合多句法结构的Bi-Tree-LSTM网络,对所述序列预测层得到的联合输入进行学习从而获取三元组结构信息的候选关系;
端到端的训练:将所述关系预测层嵌套在序列预测层之上,利用共享参数进行端到端的训练,通过SoftMax分类器对所述候选关系进行抽取从而得到文本事件因果关系。
优选的,在所述融合注意力机制的Bi-LSTM-CRF网络中,通过其中的Bi-LSTM获取文本事件序列的双向隐状态编码信息;基于注意力机制进行二次学习来调整所述双向隐状态编码信息在原始文本事件序列上的权重分布;通过其中的CRF层基于BILOU标注模式进行解码,从而预测文本事件的标签信息。
优选的,步骤S4中所述的利用因果传递熵算法确定两搜索指数曲线对应的文本事件对之间的因果关系具体为:
所述传递熵的规则定义如下:
两搜索指数曲线对应的文本事件对A,B的传递熵为TEA→B,k次置换检验的传递熵向量为若满足则A→B的因果关系是显著的;其中α为选定的显著性水平
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911193643.1/2.html,转载请声明来源钻瓜专利网。