首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于DQN的云际资源接入的决策方法及系统在审

申请号：	202310318592.0	申请日：	2023-03-28
公开（公告）号：	CN116471300A	公开（公告）日：	2023-07-21
发明（设计）人：	曾荣飞;赵明洋;褚晓文;刘羽飞;韩子森	申请（专利权）人：	东北大学
主分类号：	H04L67/12	分类号：	H04L67/12;G06N3/045;G06N3/0464;G06N3/092;H04L41/14;H04L41/142
代理公司：	北京科领智诚知识产权代理事务所(普通合伙) 11782	代理人：	陈士骞
地址：	110819 辽宁***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 dqn 云际资源接入决策方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于DQN的云际资源接入的决策方法，其特征在于，包括：

设定动作a_t，所述动作a_t包括接入、不接入；

初始化评估网络Q(s_t,a_t；w)，其中，s_t表示状态信息，w表示第一训练参数；

设置目标网络为其中，w^-表示第二训练参数；

采集状态信息s_t，所述状态信息s_t包括平台已有资源信息、用户需求信息以及云商的待接入资源信息；

所述评估网络Q(s_t,a_t；w)根据所述状态信息s_t执行所述动作a_t，得到云商价值r_t；

利用所述目标网络和所述云商价值r_t循环迭代训练所述评估网络Q(s_t,a_t；w)，得到更新后的第一训练参数；

利用所述更新后的第一训练参数更新所述目标网络，得到新目标网络；

将所述状态信息s_t输入所述新目标网络，得到初步接入决策；

根据所述初步接入决策判断是否接入，若接入，云商提供待接入资源；若不接入，云商判断是否改变待接入资源信息，若是，将改变后的所述状态信息输入所述新目标网络，再次判断是否接入，若否，不接入资源；

将接入情况反馈至平台，所述状态信息s_t更新后，跳转至采集状态信息s_t步骤。

2.根据权利要求1所述的一种基于DQN的云际资源接入的决策方法，其特征在于，所述评估网络Q(s_t,a_t；w)执行所述动作a_t时，采取ε-贪心方法决定动作其中，ε表示探索参数。

3.根据权利要求1所述的一种基于DQN的云际资源接入的决策方法，其特征在于，利用所述目标网络和所述价值r_t循环迭代训练所述评估网络，得到更新后的第一训练参数，具体为：

将所述状态信息s_t、动作a_t、云商价值r_t和状态信息s_t+1存储至缓冲区，得到存储信息(s_t,a_t,r_t,s_t+1)；

从所述缓冲区中随机采样m条所述存储信息(s_t,a_t,r_t,s_t+1)；

设置目标值为y_t＝r_t+max_aQ(s_t+1,a,w^-)；

更新所述第一训练参数，当所述评估网络与所述目标值的误差满足预定要求时，对应的所述第一训练参数作为更新后的第一训练参数。

4.根据权利要求1所述的一种基于DQN的云际资源接入的决策方法，其特征在于，利用所述更新后的第一训练参数更新所述目标网络，具体为：

利用所述更新后的第一训练参数替换所述第二训练参数。

5.根据权利要求1所述的一种基于DQN的云际资源接入的决策方法，其特征在于，初始化评估网络Q(s_t,a_t；w)之前，还包括：

利用卷积神经网络生成评估网络。

6.根据权利要求1所述的一种基于DQN的云际资源接入的决策方法，其特征在于，每个所述云商具有多项待接入资源，计算初步接入决策时，遍历每一项待接入资源得到每一项待接入资源的价值r_i，对所有待接入资源的价值r_i求和，得到对应的所述云商价值r_t。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310318592.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种信道估计方法、装置、设备及介质
下一篇：一种低噪声高PSR的LDO电路

同类专利

专利分类

H04 电通信技术
H04L 数字信息的传输，例如电报通信

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top