[发明专利]模型构建方法、任务分配方法、装置、设备及介质有效
申请号: | 202110302078.9 | 申请日: | 2021-03-22 |
公开(公告)号: | CN113032904B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 任涛;胡哲源;谷宁波;牛建伟;杜东峰;豆渊博;李青锋 | 申请(专利权)人: | 北京航空航天大学杭州创新研究院 |
主分类号: | G06F30/15 | 分类号: | G06F30/15;G06F30/20;G06F9/445;G06F9/48;G06F9/50;G06F119/12 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 董艳芳 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 构建 方法 任务 分配 装置 设备 介质 | ||
1.一种模型构建方法,其特征在于,应用于训练设备,所述训练设备配置有待训练的位置模型以及任务分配模型,所述方法包括:
初始化所述位置模型、所述任务分配模型、第一无人机的状态以及第一移动终端的状态,其中,所述第一无人机用于为所述第一移动终端提供边缘计算服务;
将所述位置模型以及任务分配模型进行以下迭代,直到满足预设的迭代条件:
根据所述第一移动终端与所述第一无人机之间当前时刻的第一状态,通过所述位置模型获得所述第一无人机下一时刻的预测位置;
根据所述预测位置更新所述第一状态;
根据更新后的第一状态,通过预设第一奖励策略获得与所述更新后的第一状态相对应的第一奖励值;
根据所述第一奖励值,更新所述位置模型的模型参数;
根据所述预测位置确定所述第一无人机与所述第一移动终端之间当前时刻的第二状态;
根据所述第二状态,通过所述任务分配模型确定所述第一无人机与所述第一移动终端之间下一时刻的任务分配结果;
根据所述任务分配结果,更新所述任务分配模型的模型参数。
2.根据权利要求1所述的模型构建方法,其特征在于,所述根据更新后的第一状态,通过预设第一奖励策略获得与所述更新后的第一状态相对应的第一奖励值,包括:
通过预设第一奖励策略获得与所述更新后的第一状态相对应的第一奖励值;
当根据所述更新后的第一状态,确定所述第一无人机满足任意一条第一限制条件时,则通过预设第一负奖励值调整所述第一奖励值,其中,所述第一限制条件包括:
所述第一无人机的移动速度超过速度阈值;
所述第一无人机的移动频率超过频率阈值。
3.根据权利要求1所述的模型构建方法,其特征在于,所述根据所述任务分配结果,更新所述任务分配模型的模型参数,包括:
根据所述任务分配结果更新所述第二状态;
根据更新后的第二状态,通过预设第二奖励策略获得与所述第二状态相对应的第二奖励值;
根据所述第二奖励值,更新所述位置模型的模型参数。
4.根据权利要求3所述的模型构建方法,其特征在于,所述根据更新后的第二状态,通过预设第二奖励策略获得与所述第二状态相对应的第二奖励值,包括:
通过预设第二奖励策略获得与所述第二状态相对应的第二奖励值;
当根据所述更新后的第二状态,确定所述第一无人机与所述第一移动终端满足意一条第二限制条件时,则通过预设第二负奖励值调整所述第二奖励值,其中,所述第二限制条件包括:
同一任务同时在第一无人机以及第一移动终端运行;
任务在第一无人机与第一移动终端之间传输时所消耗的总能量超过能量阈值;
至少一个任务的完成耗时超过时长阈值。
5.一种任务分配方法,其特征在于,应用于执行设备,所述执行设备配置有预训练的位置模型以及任务分配模型,所述预训练的位置模型以及任务分配模型由权利要求1-4任意一项所述的模型构建方法进行训练获得,所述方法包括:
获取第二移动终端与第二无人机之间当前时刻的第三状态;
根据所述第三状态,通过所述位置模型确定所述第二无人机在下一时刻的预测位置;
根据所述第二无人机在下一时刻的预测位置,确定所述第二无人机与第二移动终端之间的第四状态;
根据所述第四状态,通过所述任务分配模型确定所述第二无人机与所述第二移动终端之间的任务分配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学杭州创新研究院,未经北京航空航天大学杭州创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110302078.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于物联网的图书智能管理系统
- 下一篇:一种鱼鳞片的加工方法