[发明专利]时间触发调度模型的训练、时间触发调度方法及装置有效
| 申请号: | 202111137291.5 | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN114006827B | 公开(公告)日: | 2023-01-24 |
| 发明(设计)人: | 万海;贾宏宇;赵曦滨 | 申请(专利权)人: | 清华大学 |
| 主分类号: | H04L41/16 | 分类号: | H04L41/16;H04L41/12 |
| 代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 陈超德;吴昊 |
| 地址: | 100089*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 时间 触发 调度 模型 训练 方法 装置 | ||
1.一种时间触发调度模型的训练方法,其特征在于,所述方法包括:
提取由网络设备构成的拓扑图中每条链路的基础特征向量;所述基础特征向量包括原始特征向量和可用资源向量,所述原始特征向量包括以下一项或多项的组合:待调度时间触发TT流的起点、待调度TT流的终点、当前链路是否被访问、合法的相位比例、带宽的利用率以及所述待调度TT流的周期;
针对每条链路,根据所述链路的基础特征向量和所述链路的邻居向量,获得所述链路的嵌入向量;所述邻居向量为与所述链路相邻的其他链路的基础特征向量;
根据所有链路的嵌入向量的平均值获取全局向量;
将每条链路的所述基础特征向量、所述嵌入向量和所述全局向量进行拼接获得所述链路的目标向量;
将所述目标向量输入策略网络,确定所述待调度TT流的第一下一跳链路、所述第一下一跳链路对应的第一转发相位以及所述第一转发相位中为所述待调度TT流分配的第一时隙;
若利用所述第一时隙和所述第一下一跳链路对所述待调度TT流进行调度所到达的网络设备不是所述终点,则更新所述目标向量以及时隙占用情况,并将更新后的目标向量输入所述策略网络确定所述待调度TT流的第二下一跳链路、所述第二下一跳链路对应的第二转发相位以及所述第二转发相位中为所述待调度TT流分配的第二时隙,并利用所述第二时隙和所述第二下一跳链路对所述待调度TT流进行调度,直至达到所述终点;
在针对多条待调度TT流进行调度过程中到达预设调度终止条件时,利用策略梯度算法更新时间触发调度模型的参数,并利用更新后的时间触发调度模型继续对待调度TT流进行调度,直至目标函数取值最大时,获得目标时间触发调度模型;所述目标函数是与所述拓扑图、待调度TT流的调度需求、确定下一跳链路、转发相位、时隙分配相关的函数。
2.如权利要求1所述的方法,其特征在于,提取由网络设备构成的拓扑图中每条链路的基础特征向量中的可用资源向量,包括:
将每个相位的可用时隙率作为输入神经元输入周期层,获得不同周期TT流的空余时隙信息;其中每2i个输出神经元表示一种周期的TT流的空余时隙信息,并且每2i个输出神经元分别与2k-i个输入神经元相连;0≤i≤k-1,且i为整数,k为正整数;若输出神经元个数小于输入神经元个数,则增加虚拟输出神经元以使得输出神经元个数与输入神经元个数相同;
将所述不同周期TT流的空余时隙信息输入预设数量的全连接层进行降维处理,获得每条链路的所述可用资源向量。
3.如权利要求1所述的方法,其特征在于,针对每条链路,根据所述链路的基础特征向量和所述链路的邻居向量,获得所述链路的嵌入向量,包括:
通过图卷积网络GCN网络,将链路v的基础特征向量和所述链路v的邻居向量输入第一公式迭代k次,获得所述链路的嵌入向量
所述第一公式为:
其中,k为正整数,g和f表示激活函数,u表示链路v的邻居链路,ξ(v)表示邻居链路集合。
4.如权利要求1所述的方法,其特征在于,根据所有链路的嵌入向量的平均值获取全局向量,包括:
通过图摘要网络GSN,计算所有链路的嵌入向量的平均值;
通过全连接层和激活函数对所述平均值进行编码,获得所述全局向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111137291.5/1.html,转载请声明来源钻瓜专利网。





