[发明专利]一种线上事故等级预测方法和装置在审
| 申请号: | 201810862822.9 | 申请日: | 2018-08-01 |
| 公开(公告)号: | CN109146152A | 公开(公告)日: | 2019-01-04 |
| 发明(设计)人: | 朱翔宇 | 申请(专利权)人: | 北京京东金融科技控股有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/26;G06F17/27;G06N3/04 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;李阳 |
| 地址: | 101111 北京市北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 等级预测 方法和装置 文本数据 预测模型 计算机技术领域 上报 循环单元 连接层 拼接层 嵌入层 池化 对线 两层 门限 预设 预测 | ||
本发明公开了线上事故等级预测方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取当前线上事故上报的文本数据;通过预设的预测模型,根据当前线上事故上报的文本数据预测事故等级;其中,预测模型包括嵌入层、Dropout层、两层双向门限循环单元、池化层、拼接层和全连接层。该实施方式能够解决现有技术无法对线上事故无法进行快捷、精准的等级预测的问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种线上事故等级预测方法和装置。
背景技术
基于线上事故上报系统中,关于线上事故上报的文本描述,给出该事故的定级,例如:特大事故、重大事故、严重事故、一般事故、轻微事故。文本描述包括对事故时间、过程原因等信息。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
目前,对于评估事故等级现有的技术更多依赖于人工化,如果想准确了解事故情况具有较高的难度。另外,事故上报表达口语化较严重,影响评判效果。而现有的的关于文本分类的方式,只是简单的利用TF-IDF特征,且只是权重计算,不能很好的解决实际问题中不同背景的分类问题。其中,TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。
发明内容
有鉴于此,本发明实施例提供一种线上事故等级预测方法和装置,能够解决现有技术无法对线上事故无法进行快捷、精准的等级预测的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种线上事故等级预测方法,包括获取当前线上事故上报的文本数据;通过预设的预测模型,根据当前线上事故上报的文本数据预测事故等级;其中,预测模型包括嵌入层、Dropout层、两层双向门限循环单元、池化层、拼接层和全连接层。
可选地,通过预设的预测模型,根据当前线上事故上报的文本数据预测事故等级之前,包括:
对当前线上事故上报的文本数据进行分词处理和去除停用词处理,以对处理后的文本数据进行标准化处理;
通过word2vec模型对词进行词向量处理。
可选地,所述预测模型,包括:
将线上事故上报的文本数据输入至嵌入层,以将所述文本数据转换为预设规则的词向量;
通过Dropout层随机去除部分神经元,进而通过两层双向门限循环单元提取上下文信息和全局信息;
再经过池化层获得描述更有效的词,通过拼接层和全连接层分别将两个及以上的特征图进行拼接,和进行训练迭代。
可选地,所述Dropout层采用SpatialDropout1D,以将词向量加入dropout,以随机去除部分神经元。
可选地,所述池化层包括最大池化层、平均池化层和Attention层;
其中,利用最大池化层和平均池化层获取线上事故上报的文本数据中描述最有效的词;同时加入至Attention层,以选择线上事故上报的文本数据中描述更有效的词语。
另外,根据本发明实施例的一个方面,提供了一种线上事故等级预测装置,包括获取模块,用于获取当前线上事故上报的文本数据;预测模块,用于通过预设的预测模型,根据当前线上事故上报的文本数据预测事故等级;其中,预测模型包括嵌入层、Dropout层、两层双向门限循环单元、池化层、拼接层和全连接层。
可选地,所述获取模块,还用于:
对当前线上事故上报的文本数据进行分词处理和去除停用词处理,以对处理后的文本数据进行标准化处理;
通过word2vec模型对词进行词向量处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东金融科技控股有限公司,未经北京京东金融科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810862822.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





