[发明专利]一种基于深度学习的多属性数据建模方法有效
申请号: | 201811488860.9 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109635246B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 文超;黄平;李忠灿;汤轶雄;蒋朝哲 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06N3/04;G06N3/08;G06Q10/04;G06Q50/30 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 何红信 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 属性 数据 建模 方法 | ||
1.一种基于深度学习的多属性数据建模方法,其特征在于:包括以下步骤:
S1:根据当前高速铁路区段的历史运营数据,提取列车晚点的影响因素Xk,k∈{1,2,…,K}及列车晚点观测值,其中K为提取晚点因素个数;影响因素Xk包括设备因素、计划运行图相关因素和实际运行图相关因素,所述设备因素包括车站股道数X1和区间长度X2,所述计划运行图相关因素包括区间计划运行时间X3、当前站计划出发间隔时间X4和预测站计划到达间隔时间X5,所述实际运行图相关因素包括列车已知晚点状态X6;
S2:判断影响因素Xk的属性,其中影响因素Xk的属性包括时空特性数据、时间序列数据和静态数据;
S3:根据影响因素Xk的属性的不同,将时空特性数据输入卷积长短期记忆(Conv-LSTM)模型,将时间序列数据输入长短期记忆(LSTM)模型,将静态数据输入全连接神经网络(FCNN)模型;
S4:基于交叉验证分别优化Conv-LSTM模型的神经元层数及各层神经元数、LSTM模型的神经元层数及各层神经元数、和FCNN模型的神经元层数及各层神经元数,筛选出Conv-LSTM模型中具有最小损失函数值的神经元层数m1及各层神经元数n1、LSTM模型中具有最小损失函数值的神经元层数m2及各层神经元数n2、和FCNN模型中具有最小损失函数值的神经元层数m3及各层神经元数n3;
S5:选定神经元层数为m1层且每层为n1个神经元的Conv-LSTM模型、神经元层数为m2层且每层为n2个神经元的LSTM模型、和神经元层数为m3层且每层为n3个神经元的FCNN模型为最终的多属性数据模型。
2.根据权利要求1所述的一种基于深度学习的多属性数据建模方法,其特征在于:在步骤S2中,影响因素Xk的属性判断标准如下:车站股道数X1和区间长度X2为静态数据,区间计划运行时间X3、当前站计划出发间隔时间X4和预测站计划到达间隔时间X5为时间序列数据,列车已知晚点状态X6为时空特性数据。
3.根据权利要求1所述的一种基于深度学习的多属性数据建模方法,其特征在于:步骤S4的具体步骤如下:
S401:利用Keras深度学习库将Conv-LSTM模型、LSTM模型和FCNN模型进行融合,融合得到一个多维向量;
S402:将融合得到的多维向量传入单FCNN神经元,由单FCNN神经元输出得到模型拟合值并得到最终融合模型;
S403:根据模型拟合值及列车晚点观测值yi确定融合模型的损失函数;
S404:将时空特性数据、时间序列数据和静态数据作为数据集,然后将数据集分为训练集及测试集对融合模型进行训练,分别选择Conv-LSTM模型在测试集上损失函数最小的神经元层数及各层神经元数、LSTM模型在测试集上损失函数最小的神经元层数及各层神经元数、和FCNN模型在测试集上损失函数最小的神经元层数及各层神经元数。
4.根据权利要求3所述的一种基于深度学习的多属性数据建模方法,其特征在于:在步骤S403中,选用模型拟合值与列车晚点观测值yi的均方误差作为损失函数:
其中,yi为列车晚点观测值,为模型拟合值,N为样本量;然后利用误差反向传播算法对融合模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811488860.9/1.html,转载请声明来源钻瓜专利网。