[发明专利]深度学习系统和方法以及使用深度学习的无线网络优化有效
| 申请号: | 201880041287.9 | 申请日: | 2018-07-05 |
| 公开(公告)号: | CN110770761B | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | 谭涌溪;杨劲;宋其涛;陈云君;叶张翔 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 通过生成多个经验元组和基于生成的经验元组更新神经网络,使用深度强化学习(DRL)技术训练神经网络,以调节无线网络中的小区参数。经训练的神经网络可以用于选择动作以调节小区参数。每个经验元组包括小区标识符、第一状态、第二状态、应用至小区使该小区从第一状态转变到第二状态的动作、局部奖励、以及全局奖励。基于每个动作是否可被接受更新神经网络,基于与每个动作相关联的全局奖励和局部奖励确定每个动作是否可被接受。 | ||
| 搜索关键词: | 深度 学习 系统 方法 以及 使用 无线网络 优化 | ||
【主权项】:
1.一种方法,包括:/n使用一组权值初始化神经网络,所述神经网络用于确定动作,所述动作调节与无线网络中的基站相关联的小区的一个或多个设置,每个基站为一个或多个小区内的用户设备UE提供通信服务;以及/n通过使用深度强化学习DRL过程训练所述神经网络,所述DRL过程包括:/n生成针对所述无线网络中的多个小区的第一多个经验元组,每个经验元组包括标识小区的小区标识符、所述小区的第一状态、所述小区的第二状态、使所述小区从所述第一状态转移到所述第二状态的动作、以及对采取所述动作的奖励值,其中,小区的状态包括提供所述小区的覆盖区域的基站的设置,奖励值是基于从所述无线网络中的UE接收的测量报告使用成本函数计算的,其中,每个经验元组可以是DRL生成的经验元组或专家生成的经验元组,在所述DRL生成的经验元组中,相应动作由DRL智能体根据DRL技术基于所述神经网络选择,在所述专家生成的经验元组中,所述相应动作基于专家经验提供,并且其中,基于第一准则确定动作是由所述DRL智能体基于所述神经网络选择还是基于所述专家经验提供;以及/n从所述第一多个经验元组中选择第二多个经验元组;以及/n根据所述第二多个经验元组中的奖励值更新所述神经网络的所述一组权值。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880041287.9/,转载请声明来源钻瓜专利网。
- 上一篇:对物理系统的未来状态进行对象级预测
- 下一篇:神经网络交叉开关堆叠





