[发明专利]一种智能交通信号控制方法、装置及系统有效
申请号: | 201811615184.7 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109615885B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 金峻臣;吴越;李瑶;杨宪赞;周浩敏;郭海锋 | 申请(专利权)人: | 银江股份有限公司 |
主分类号: | G08G1/07 | 分类号: | G08G1/07;G08G1/01 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 交通信号 控制 方法 装置 系统 | ||
1.一种智能交通信号控制方法,其特征在于:包括步骤:
采集交通状态数据、若干奖励函数、协调信息、控制指令集,输入已构建的交通信号控制模型,输出最优控制指令;
所述交通信号控制模型,包括若干奖励函数、一控制指令集、一转移概率、一协调信息,所述奖励函数以交通状态与控制指令为变量,所述控制指令集与所述协调信息相关联,具体为:
其中,i=1,2,…,nobj为奖励函数的数量,x为交通状态,u为控制指令,ri(x,u)为第i个奖励函数,π(x)为控制指令集,P(xsub|x,u)∈[0,1]为给定交通状态x与控制指令u的后续交通状态xsub的转移概率;c为协调信息;γ∈[0,1]为考虑重要性水平的折扣因子;
所述交通信号控制模型求解包括:
多目标决策步骤,获得若干个信号控制目标,所述信号控制目标为在未来时间段的积累奖励函数值最优,所述奖励函数值由所述奖励函数、所述转移概率计算获得,将控制目标转化为可迭代目标,具体为:
其中,Q*(x0,u0)为最优积累奖励,Qπ(x0,u0)为控制指令集π下对应于多个目标的优化积累奖励向量,Qπ(x0,u0)表示如下:
其中,为控制指令集π下对应于第i个目标的优化积累奖励向量,表示如下:
其中,函数E为期望值函数,P(xt+1|xt,ut)为给定交通状态xt与控制指令ut的后续交通状态xt+1的转移概率,γt为t时刻的虑重要性水平的折扣因子,ri(xt,ut)为交通状态xt与控制指令ut对应的第i个目标的奖励函数;
所述将控制目标转化为可迭代目标,具体为:
Q*(xt,ut)=r(xt,ut)+γQ*(xt+1,ut+1)
r(xt,ut)=[r1(xt,ut),r2(xt,ut),...,rn(xt,ut)]T;
多目标控制步骤,在可迭代目标约束下,求解满足所述可迭代目标的最优控制指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江股份有限公司,未经银江股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811615184.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无线交通信号灯管理系统
- 下一篇:统筹交通信号灯控制系统