[发明专利]一种面向风险图谱的关联风险证据高效挖掘与监控方法和装置在审
| 申请号: | 202011439026.8 | 申请日: | 2020-12-07 |
| 公开(公告)号: | CN112668836A | 公开(公告)日: | 2021-04-16 |
| 发明(设计)人: | 刘焕勇;刘张宇;邹志龙 | 申请(专利权)人: | 数据地平线(广州)科技有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/36;G06F40/247;G06F16/35;G06F40/186 |
| 代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
| 地址: | 511458 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 风险 图谱 关联 证据 高效 挖掘 监控 方法 装置 | ||
1.一种面向风险图谱的关联风险证据高效挖掘与监控方法,其特征在于,包括以下步骤:
运用自然语言处理手段,将对现有业务进行系统整理形成的风险体系或具体的风险点集合,以层级组织的方式组织,进行风险的节点化和风险节点的关联化,形成风险图谱;
根据资讯文本源和指标数据源两个数据来源,选择历时和实时两个时间域,对风险图谱中的风险节点进行风险事件证据挖掘和风险指标证据挖掘;
将挖掘形成的风险事件证据和风险指标证据自动整理成风险证据报告,以供决策和汇报使用。
2.根据权利要求1所述的方法,其特征在于,所述以层级组织的方式组织,是利用层次分组的思想,将具有高度相关性关联的事件分成若干个事件组;所述风险的节点化,是将风险整理为一系列动作性的谓词性节点;所述风险节点的关联化,是将一系列谓词性节点之间的关联关系进行组织和标记,通过传导式的组织方式,使得各个风险事件之间形成一个关联网络。
3.根据权利要求1所述的方法,其特征在于,所述风险事件证据挖掘包括历时风险事件证据挖掘和实时风险事件证据挖掘;所述历时风险事件证据挖掘,包括:
1)通过采集网络公开文本或接入用户本地自有数据,形成文本材料库;
2)利用主流索引数据库,针对文本材料库建立索引,形成文本索引库;在建立索引的同时,添加静态同义词表;
3)获取风险图谱中的所有节点集合,遍历所有集合中所有节点,执行步骤4)-10);
4)利用静态同义词表进行事件名称扩展,得到事件扩展列表;
5)将事件扩展列表进行查询构造,在文本索引库中进行节点的短语搜索;将命中的文档记录进行分句处理,包含任意事件列表元素的句子进行保留,形成候选事件句;
6)对候选事件句集合中所有候选事件进行二分类,用来判断候选事件是否允以保留,选择二分类的事件成立性规则模型,最终输出候选事件句集合;
7)针对步骤6)输出的候选事件句集合进行聚类,将同义不同形的事件句进行聚合,形成若干个事件句类,以及事件句类中的句子集合,标记为簇内句子集合,同时将事件句类中的中心事件句作为标准事件句;
8)借助关键性判定规则对步骤7)输出的标准事件句进行关键性打分;
9)将得到的事件相关信息进行组装,组装的信息包括事件句的原文描述、事件句的簇内句子集合、事件句的关键性得分、事件句来源的文档、事件句所在的时间;
10)将组装得到的事件相关信息进行存储,得到最终的事件风险证据。
4.根据权利要求3所述的方法,其特征在于,所述实时风险事件证据挖掘包括:
1)针对网络文本数据源进行实时的文本采集,输出资讯文本流;
2)获取风险图谱中的所有节点集合,遍历所有集合中所有节点,执行步骤3)-5);
3)利用静态同义词表进行事件名称扩展,得到事件扩展列表;
4)将事件扩展列表,构造模式匹配actree,针对实时文本进行模式匹配,将包含任一事件扩展列表中元素的事件句进行保留,形成候选事件句;
5)执行历时风险事件证据挖掘的步骤6)-10)。
5.根据权利要求1所述的方法,其特征在于,所述风险指标证据挖掘,针对风险图谱中的风险节点,从后台的数据指标库中进行人机互助的指标关联,将节点一对多地与数据指标库中的数据指标相联系,设定异动阈值和指标计算公式,从历时和实时两个角度出发,分别输出对应时间的异动信息;所述风险指标证据挖掘包括历时风险指标证据挖掘和实时风险指标证据挖掘。
6.根据权利要求5所述的方法,其特征在于,所述历时风险指标证据挖掘包括:获取风险图谱中的风险节点,借助外部的数据指标库进行数据关联,同时由风险历时事件证据库获取事件信息,并进行节点对齐以及时间约束,最终通过对预先设定好的指标变动公式进行解析和数据比对,找出数据变动的具体情况,形成指标数据库;所述实时风险指标挖掘包括:获取风险图谱中的风险节点,借助外部的数据指标库进行数据关联,同时通过对数据指标进行实时监控,形成数据实时指标,最终通过对预先设定好的指标变动公式进行解析和数据比对,找出数据变动的具体情况,形成指标数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数据地平线(广州)科技有限公司,未经数据地平线(广州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011439026.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空调新风量控制方法、装置及系统
- 下一篇:活泼亚甲基型除醛剂及其应用
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





