[发明专利]风险事件分级方法及装置在审
申请号: | 202011487708.6 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112579773A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 林廷懋;谢雨成;柯颖;钟伊妮;王周宇 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 贾磊;李辉 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 事件 分级 方法 装置 | ||
本申请提供了一种风险事件分级方法及装置,其中,该方法包括:采集目标新闻文本;应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。本申请能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种风险事件分级方法及装置。
背景技术
新闻舆情对经济市场及相关活动的重要性不言而喻,准确把握新闻报道中关于各企业的负面事件报道,对新闻文本中涉及的风险事件的严重程度进行评估分级,能够为银行、投资机构乃至个人做相关决策提供巨大助力。
当前新闻文本风险事件的严重程度分级尚不成熟,当前的新闻报道中负面舆情的产生速度极快,对后续决策过程产生较大的处理压力。风险抽取的召回率不高,不足以满足业务实际需求。
在现有技术中,一种风险事件分级方法为直接由人工阅读新闻文本,总结、记录得到风险事件严重程度,首先,新闻文本中风险事件报道密度较为稀疏,人工阅读量巨大;其次,人工识别对文本阅读人员有较高的业务知识要求,人力成本高;另一种风险事件分级方法为将风险事件分级问题直接转化为分类问题实现分级,该方法存在数据稀疏导致的训练样本需求量大和分类算法的可解释性低的问题。
发明内容
针对现有技术中的至少一个问题,本申请提出了一种风险事件分级方法及装置,能够有效实现风险事件的分级,进而能够提高后续金融交易决策的准确性。
为了解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种风险事件分级方法,包括:
采集目标新闻文本;
应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性;
应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息;
基于所述事件属性、主体信息和预设的风险事件分级模型,确定所述风险事件的风险等级。
进一步地,所述应用预设的风险事件类型抽取模型、风险事件属性抽取模型和所述目标新闻文本,确定对应的风险事件的事件属性,包括:
应用所述预设的风险事件类型抽取模型和目标新闻文本,确定所述风险事件的事件类型;
应用所述预设的风险事件属性抽取模型和事件类型,确定所述风险事件的事件属性。
进一步地,所述应用预设的风险事件主体抽取模型、实体链接模型和所述目标新闻文本,确定所述风险事件的主体信息,包括:
应用所述预设的风险事件主体抽取模型和目标新闻文本,确定所述风险事件的事件主体;
应用所述预设的实体链接模型和事件主体,确定所述风险事件的主体信息。
进一步地,所述预设的风险事件类型抽取模型为预先训练Bert-Dense-softmax模型得到的。
进一步地,所述预设的风险事件主体抽取模型为预先训练Bert-BILSTM-CRF模型得到的。
进一步地,所述预设的风险事件属性抽取模型为预先训练Albert预训练模型得到的。
进一步地,所述预设的实体链接模型包括:无监督实体链接模型和已训练完成的有监督实体链接模型。
第二方面,本申请提供一种风险事件分级装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011487708.6/2.html,转载请声明来源钻瓜专利网。