[发明专利]基于Q－learning的RFID多阅读器防碰撞算法在审

申请号：	201810407758.5	申请日：	2018-04-26
公开（公告）号：	CN108647542A	公开（公告）日：	2018-10-12
发明（设计）人：	郑嘉利;袁源	申请（专利权）人：	广西大学
主分类号：	G06K7/10	分类号：	G06K7/10
代理公司：	暂无信息	代理人：	暂无信息
地址：	530004 广西壮族***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及无线射频识别中的阅读器防碰撞技术，具体地说是基于Q‑learning的RFID多阅读器防碰撞算法。整个算法过程包括建立马尔可夫模型、定义状态与动作空间、迭代学习、更新参数以及寻找最佳策略。本发明利用Q‑learning算法中自主学习的方式实现最佳信道资源分配，即通过递归的方式寻求最优值，Q表的初始值为0，根据一定的学习准则进行学习，从而不断更新迭代Q值，最终根据Q表就可以将信道资源进行最佳分配，使碰撞率达到最低，提高标签识别率，实现整体性能的提升。
搜索关键词：	阅读器防碰撞算法马尔可夫模型无线射频识别标签识别迭代学习定义状态动作空间更新参数算法过程信道资源资源分配最佳信道防碰撞递归迭代算法学习分配更新
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种适用于RFID系统的基于Q‑learning的阅读器防碰撞算法，约定阅读器个数为N，系统可用信道资源数为R，学习次数为T，折扣系数为γ，学习效率α，其特征在于，该算法步骤还包括：步骤1)初始化：根据RFID网络中阅读器和信道资源的个数，初始化状态空间S和动作空间A，初始化Q表中所有的Q(s，a)＝0，其中s∈S，a∈A；步骤2)执行动作：在当前状态s下，若对应的Q值都为0，即第一次访问该状态，则随机选择动作；否则选择Q表中最大值所对应的动作，通过该动作a分配一个信道资源给节点，从而a∈{1，2，...，R}；步骤3)记录奖赏值：奖赏值c(s，a)评价动作产生后的效果，其值由公式c(s，a)＝n1(s，a)c1+n2(s，a)c2+n3(s，a)c3+n4(s，a)c4确定，执行步骤2)中的动作a之后，记录奖赏值c和下一状态s′；步骤4)当系统的学习还未达到学习次数T时，转到步骤2)，当超过学习次数T时则终止学习过程，通过学习得到的最优策略，将信道分配给每个阅读器。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广西大学，未经广西大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810407758.5/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K7-00 读出记录载体的方法或装置
G06K7-01 .细目
G06K7-02 .采用气动或液压方法的，例如，用压缩空气穿孔的读出；借助于声学装置的
G06K7-04 .采用机械装置的，例如，用控制电接触点的插头
G06K7-06 .采用当有或无标记时，电流导通装置的，例如，导电标记用的接触电刷
G06K7-08 .采用检测静电或磁场变化的装置的，例如，检测电极间电容的变化

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Q－learning的RFID多阅读器防碰撞算法在审

专利文献下载