[发明专利]基于双重指针网络的车货匹配方法在审
申请号: | 202111170383.3 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113947298A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 孙知信;蔡岳;王恩良;孙哲;宫婧;赵学健;胡冰;汪胡青 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06Q40/02 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双重 指针 网络 匹配 方法 | ||
本发明提供了一种基于双重指针网络的车货匹配方法,对车货匹配问题建模,得到车货匹配问题数学模型,生成车货匹配情况,对车货匹配情况进行预处理;然后使用Critic网络与双重指针网络对抗的方法,训练双重指针网络,训练数据使用生成的预处理模拟车货匹配情况,得到优化的双重指针网络并用以求解实际车货匹配情况,求解后采用映射方法将优化车辆序列和优化货物序列映射成车货匹配问题的结果。本发明通过对车货匹配问题进行数学建模,然后生成多个车货匹配情况并采用对抗的方法来训练双重指针网络,最后使用训练后优化的双重指针网络来求解实际车货匹配问题,解决现有车货匹配问题中无法解决两个分属不同问题但相关的序列决策的问题。
技术领域
本发明涉及一种基于双重指针网络的车货匹配方法,属于深度学习领域。
背景技术
车货供需匹配作为组合优化的一种特殊问题,实质上是一种集TSP(旅行商问题)、VRP(车辆路由问题)、背包问题、装箱问题、带时间窗等的复杂组合优化问题,近几年于国内形成一个新的研究领域。
在早期研究的TSP与VRP问题中,模拟退火算法(SAA)、粒子群算法(PSO)、遗传算法(GA)等是常见的启发式算法。近年来出现了将梯度策略算法应用于组合优化算法,并使用神经网络和强化学习同时求解TSP问题与背包问题,取得了满意的结果。如今,深度强化学习(DRL)在组合优化领域得被广泛研究与应用。与早期启发算法相比,深度强化学习方法充分利用了历史样本。对存在样本饥荒现象的问题有着更优结果。此外,大部分启发式算法对于不同规模的问题存在“瓶颈问题”,处理更大规模的问题时,对算法优化效果并不明显且需要耗费更长的时间与资源。而深度强化学习在不同规模问题的处理上,泛化性能良好。
其中,车货匹配的场景通过建模转换为序列决策问题,而序列决策问题可以看作一个seq2seq模型。传统的seq2seq模型的处理方法是无法解决输出序列的词汇表会随着输入序列长度的改变而改变的问题的。指针网络解决了这样的问题,但是无法解决两个分属不同问题但相关的序列决策问题,而车货匹配就是这样的一个问题。
有鉴于此,确有必要提出一种新的基于双重指针网络的车货匹配方法,以解决上述问题。
发明内容
本发明的目的在于提供一种基于双重指针网络的车货匹配方法,以解决现有车货匹配问题中无法解决两个分属不同问题但相关的序列决策问题。
为实现上述目的,本发明提供了一种基于双重指针网络的车货匹配方法,采用双重指针网络,包括以下步骤:
步骤1:获取车货匹配问题并对车货匹配问题建模,得到车货匹配问题数学模型;
步骤2:根据步骤1中的车货匹配问题数学模型,生成车货匹配情况,包括实际车货匹配情况和至少一种模拟车货匹配情况;
步骤3:对步骤2中所述车货匹配情况进行预处理,得到预处理模拟车货匹配情况和预处理实际车货匹配情况;
步骤4:输入步骤3中的所述预处理模拟车货匹配情况,使用Critic网络与双重指针网络对抗的方法,来训练所述双重指针网络,最终得到训练后优化的双重指针网络;
步骤5:使用步骤4中所述优化的双重指针网络,求解步骤3中所述预处理实际车货匹配情况,得到优化车辆序列以及优化货物序列;
步骤6:采用映射方法将步骤5得到的所述优化车辆序列和所述优化货物序列映射为所述实际车货匹配情况的匹配结果。
作为本发明的进一步改进,步骤1中所述车货匹配问题数学模型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111170383.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理