[发明专利]基于异步优势动作评价的RFID室内定位算法有效
| 申请号: | 201910046026.2 | 申请日: | 2019-01-16 |
| 公开(公告)号: | CN109766969B | 公开(公告)日: | 2022-01-07 |
| 发明(设计)人: | 郑嘉利;李丽 | 申请(专利权)人: | 广西大学 |
| 主分类号: | G06K17/00 | 分类号: | G06K17/00;G01S5/02;H04W4/80 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 530004 广西壮族*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 异步 优势 动作 评价 rfid 室内 定位 算法 | ||
1.基于异步优势动作评价的RFID室内定位算法,包括以下步骤:
步骤1)对读写区域内的参考标签的信号强度值进行采集,获得原始信号强度(RSSI)数据;
步骤2)初始化:根据初始动作at,获得初始状态st并预处理得到相应的特征输入f(RSSItotal|st),建立全局动作网络ψ(at|st;θψ)、全局评价网络V(st;θv)以及线程子动作网络ψ(at|st;θψ′)、线程子评价网络V(st;θv′);初始化全局动作网络参数θψ=0、全局评价网络参数θv=0、线程子动作网络参数θψ′=0、线程子评价网络参数θv′=0、全局动作网络梯度dθψ=0、全局评价网络梯度dθv=0;
步骤3)训练异步优势动作评价定位模型:执行线程子动作网络中的动作,并行训练学习并计算每个线程子评价网络的价值,计算线程总回报值R,累加线程子动作网络梯度,即总和为全局动作网络梯度dθψ,累加线程子评价网络梯度,即总和为全局评价 网络梯度dθv,再对全局动作网络参数θψ和全局评价网络参数θv进行异步更新,使其跟踪学习,输出参考标签对应的具体位置,最终得到异步优势动作评价定位模型;
步骤4)精准定位:当携带有RFID标签的待定位目标进入检测区域时,读写器获取目标信息及信号强度值,并将这些数据输入到训练完成的异步优势动作评价定位模型中,定位模型准确识别数据并输出待定位目标的具体位置。
2.根据权利要求1所述的基于异步优势动作评价的RFID室内定位算法,其特征在于,所述步骤2)中的特征输入使用动作决策函数来表示,具体表示如下:
其中,RSSItotal表示在状态st下获取的所有RSSI值,σ为标准差,表示为:N表示标签总数,RSSIi表示第i个RSSI值,B表示平均值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910046026.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动物试情监控器
- 下一篇:一种固定资产管理系统





