[发明专利]基于在线学习的数据模型双驱动端到端率控制算法在审
申请号: | 202110701238.7 | 申请日: | 2021-06-23 |
公开(公告)号: | CN115515179A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 韩颖 | 申请(专利权)人: | 韩颖 |
主分类号: | H04W28/02 | 分类号: | H04W28/02;H04L47/12;H04N21/647;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710049 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 在线 学习 数据模型 驱动 端到端率 控制 算法 | ||
1.基于在线学习的数据模型双驱动端到端率控制算法,其特征在于,先用FTRL算法进行在线决策,再用多模型协作模式进行策略集成的模块生成最终决策,最后根据决策反馈信息;来更新参数。包括以下五个步骤:
阶段一:
1)传输网络监测器监测到的各个网络指标参数,如RTT、丢包率、传输速率等监测目标输入FTRL集群,通过FTRL在线学习算法产生候选决策;
阶段二:
2)将候选决策输入到策略集成模块中,生成最终决策,同时记录最终决策的准确率以及最终决策和候选决策的匹配度;
3)将最终决策的反馈信息重新输入到策略集成模块中,对策略集成模块进行更新;
阶段三:
4)将决策反馈信息以及上面记录的匹配度来更新FTRL集群的模型内部参数;
5)综合选定FTRL集群的超参数重新回到阶段一,直到效果达到阈值。
2.根据权利要求1所述的基于在线学习的数据模型双驱动端到端率控制算法,其特征在于,步骤1)的具体操作为:Monax率控制算法的核心是FTRL在线学习算法,输入为传输监测指标例如RTT、丢包率、传输速率等,输出为拥塞控制窗口的控制决策。Monax算法中采用的Utility函数主要包含三项输入内容:发送速率、RTT梯度和丢包率,计算公式如下:
其中xi为发送速率,RTTi为传输时延,Li为丢包率,RETi为RTT超过预设的RTT阈值的比例。
T为一个MI(Monitor Interval)的时间,a、t、b、c、d为参数。monax算法中采用了发送速率权重自适应的,当RTT超过阈值时,按照超过的程度降低发送速率的权重,提高RTT在utility函数中的影响程度,反之当RTT小于阈值时,增加发送速率的权重。其中RTT包含预测部分。
3.根据权利要求1所述的具有分类精度保持和带宽保护的边云协同深度学习模型训练方法,其特征在于,步骤2)的具体操作为本质上是基于多模型协作的策略集成模块。先初始化一个模型集群:{f1,f2,...fN},再根据当前的传输状态生成候选决策{y1,y2,...yN},然后计算各个模型的权重{w1,w2,...wN},最后再获取最终决策
4.根据权利要求1所述的具有分类精度保持和带宽保护的边云协同深度学习模型训练方法,其特征在于,步骤3)的具体操作为:多模型协同机制算法会实时记录每个agent的历史决策准确率,当传输效果变差时,智能切换更适合当前网络状态的agent,并更新策略集成模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩颖,未经韩颖许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110701238.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无线充电方法、装置和系统
- 下一篇:苯酚生产愈创木酚的方法和装置