[发明专利]基于Q学习的飞行器自组织网络优化链路状态路由机制在审
申请号: | 202111530693.1 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114339936A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 郑国强;郝娇杰;白薇薇;马华红;王锋;杨伟峰;冀保峰;吴红海;郑奕薇 | 申请(专利权)人: | 河南科技大学 |
主分类号: | H04W40/10 | 分类号: | H04W40/10;H04W40/12;H04W40/14;H04W84/18 |
代理公司: | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人: | 宋晨炜 |
地址: | 471000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 飞行器 组织网络 优化 状态 路由 机制 | ||
1.基于Q学习的飞行器自组织网络优化链路状态路由机制,其特征在于:包括以下步骤:
步骤一、每个节点定期向周围节点发送hello数据包,任何节点在接收到来自其他节点的hello数据包后,建立或更新邻居表信息,根据邻居表得到节点Ni的下一跳节点Ni+1集合
步骤二、当节点Ni开始传输数据,判断下一跳节点Ni+1是否在节点Ni的通信范围内,如果在通信范围内,判断下一跳节点Ni+1是否为目的节点,如果为目的节点,将直接传输数据,如果非目的节点,根据节点邻近度剩余能量El和链路质量LQ构建奖励函数,计算Ni+1的奖励值,设定0.5≤a≤1,a为常数,如果奖励值小于a,需要重新选择下一跳节点;若奖励值大于等于a,基于节点间的距离和方向计算学习速率αNi,Nj,基于奖励函数和学习速率αNi,Nj构造Q学习优化函数,计算所有Ni+1的Q值,从中选择Q值最大的节点Nj作为中继节点,即QNj;
步骤三、节点Ni利用步骤二得到的中继节点QNj进行数据传输。
2.如权利要求1所述的基于Q学习的飞行器自组织网络优化链路状态路由机制,其特征在于:Q学习优化函数计算方法为
其中,表示最大未来期望值,表示当前状态的Q值,αNi,Nj表示学习速率,γ表示折扣因子,表示下一个状态的奖励值。
3.如权利要求2所述的基于Q学习的飞行器自组织网络优化链路状态路由机制,其特征在于:奖励函数的计算方法为
其中,El表示节点的剩余能量,LQ表示链路质量,表示节点邻近度,ω1+ω2+ω3=1。
4.如权利要求3所述的基于Q学习的飞行器自组织网络优化链路状态路由机制,其特征在于:节点的剩余能量计算方法为
Etx(k,r)=Eel+kpr2 (3)
Erx(k,r)=Eelk (4)
El=Ei-Etx(k,r)-Erx(k,r) (5)
其中,k表示发送信息的比特数,r表示有效传输半径,Eel表示电路元件发送和接收单位比特数据所消耗的能量,p表示功率放大器发送单位比特数据的能耗系数,Etx(k,r)表示发送k比特数据、传输距离为r的情况下的耗能情况,Erx(k,r)表示在传输距离为r、接收k比特数据所需要消耗的能量。
5.如权利要求3所述的基于Q学习的飞行器自组织网络优化链路状态路由机制,其特征在于:链路质量的计算方法为
其中,D(Vk)表示节点方差,表示节点Ni的相对速度,n为节点总数。
6.如权利要求3所述的基于Q学习的飞行器自组织网络优化链路状态路由机制,其特征在于:节点邻近度的计算方法为
其中,dis(Ni,Nj)表示节点Ni与Nj的距离,r表示有效传输半径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111530693.1/1.html,转载请声明来源钻瓜专利网。