[发明专利]一种应用深度学习提升舆情预警准确率的系统和方法在审
申请号: | 202111634848.6 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114492439A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 毛正冉;刘嵩 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04;G06K9/62;G06Q10/04;G06Q10/06 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 李勇 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用 深度 学习 提升 舆情 预警 准确率 系统 方法 | ||
1.一种应用深度学习提升舆情预警准确率的系统,其特征在于,包括
命名实体识别终端:用于从数据输入端口获取新闻文本并输出命名实体矩阵及其置信概率矩阵P1;
新闻事件分类终端:用于从数据输入端口获取新闻文本并输出风险事件类别E2及其对应的置信概率P2;
新闻舆情预警终端:用于配制预警规则,接收命名实体矩阵及其置信概率矩阵P1、风险事件类别E2及其对应的置信概率P2,并执行预警规则,输出预警信号。
2.根据权利要求1所述的一种应用深度学习提升舆情预警准确率的系统,其特征在于:所述命名实体识别终端包括用于对新闻文本中的实体要素进行标注的实体要素标注模块、用于训练命名实体识别模型的命名实体识别模型训练模块和用于提取命名实体矩阵及其置信概率矩阵P1的命名实体要素提取模块。
3.根据权利要求1所述的一种应用深度学习提升舆情预警准确率的系统,其特征在于:所述新闻事件分类终端包括用于对新闻事件进行标注的新闻事件标注模块、用于训练Transformer模型的Transformer训练模块和用于输出风险事件类别E2及其对应的置信概率P2的新闻事件分类模块。
4.根据权利要求1所述的一种应用深度学习提升舆情预警准确率的系统,其特征在于:所述新闻舆情预警终端包括:
预警规则配置模块:用于配置预警规则;
预警信号生成模块:用于根据命名实体矩阵及其置信概率矩阵P1、风险事件类别E2及其对应的置信概率P2输出预警信号。
5.一种应用深度学习提升舆情预警准确率的方法,其特征在于,包括以下步骤:
步骤1:获取新闻文本,所述命名实体识别终端和新闻事件分类终端分别对新闻文本中的实体要素和风险事件进行标注,得到实体要素数据集D1和风险事件数据集D2;
步骤2:分别采用实体要素数据集D1和风险事件数据集D2对命名实体识别模型和Transformer模型进行训练,得到训练好的命名实体识别模型M1和训练好的新闻舆情风险事件分类模型M2;
步骤3:将实时获取的新闻文本分别输入到训练好的命名实体识别模型M1和新闻舆情风险事件分类模型M2中,所述命名实体识别模型M1输出命名实体矩阵及其置信概率矩阵P1,所述新闻舆情风险事件分类模型M2输出风险事件类别E2及其对应的置信概率P2;
步骤4:所述新闻舆情预警终端接收步骤3中的命名实体矩阵及其置信概率矩阵P1和风险事件类别E2及其对应的置信概率P2,并执行预警规则,输出预警信号。
6.根据权利要求5所述的一种应用深度学习提升舆情预警准确率的方法,其特征在于,所述步骤1具体包括:
步骤1.1:获取新闻文本,将新闻文本按照句子级别进行分割,使用shuffle函数将句子级别的新闻文本随机排序,并抽取其中设定比例的新闻文本对实体要素进行人工标注,剩余部分的新闻文本用于初版模型预测伪标签,其中置信概率高的新闻文本标记为真实标签,置信概率低的新闻样本进行人工校正标注,得到实体要素数据集D1;
步骤1.2:获取新闻文本,将新闻文本按照句子级别进行分割,使用shuffle函数将句子级别的新闻文本随机排序,并抽取其中设定比例的新闻文本对风险事件进行人工标注,剩余部分的新闻文本用于初版模型预测伪标签,其中置信概率高的新闻文本标记为真实标签,置信概率低的新闻样本进行人工校正标注,得到风险事件数据集D2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111634848.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力接线用线缆夹具及其使用方法
- 下一篇:用于在患者接口中保持湿度的装置