[发明专利]一种智能交通信号控制方法、装置及系统有效

专利信息
申请号: 201811615184.7 申请日: 2018-12-27
公开(公告)号: CN109615885B 公开(公告)日: 2020-11-10
发明(设计)人: 金峻臣;吴越;李瑶;杨宪赞;周浩敏;郭海锋 申请(专利权)人: 银江股份有限公司
主分类号: G08G1/07 分类号: G08G1/07;G08G1/01
代理公司: 暂无信息 代理人: 暂无信息
地址: 310012 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 智能 交通信号 控制 方法 装置 系统
【权利要求书】:

1.一种智能交通信号控制方法,其特征在于:包括步骤:

采集交通状态数据、若干奖励函数、协调信息、控制指令集,输入已构建的交通信号控制模型,输出最优控制指令;

所述交通信号控制模型,包括若干奖励函数、一控制指令集、一转移概率、一协调信息,所述奖励函数以交通状态与控制指令为变量,所述控制指令集与所述协调信息相关联,具体为:

其中,i=1,2,…,nobj为奖励函数的数量,x为交通状态,u为控制指令,ri(x,u)为第i个奖励函数,π(x)为控制指令集,P(xsub|x,u)∈[0,1]为给定交通状态x与控制指令u的后续交通状态xsub的转移概率;c为协调信息;γ∈[0,1]为考虑重要性水平的折扣因子;

所述交通信号控制模型求解包括:

多目标决策步骤,获得若干个信号控制目标,所述信号控制目标为在未来时间段的积累奖励函数值最优,所述奖励函数值由所述奖励函数、所述转移概率计算获得,将控制目标转化为可迭代目标,具体为:

其中,Q*(x0,u0)为最优积累奖励,Qπ(x0,u0)为控制指令集π下对应于多个目标的优化积累奖励向量,Qπ(x0,u0)表示如下:

其中,为控制指令集π下对应于第i个目标的优化积累奖励向量,表示如下:

其中,函数E为期望值函数,P(xt+1|xt,ut)为给定交通状态xt与控制指令ut的后续交通状态xt+1的转移概率,γt为t时刻的虑重要性水平的折扣因子,ri(xt,ut)为交通状态xt与控制指令ut对应的第i个目标的奖励函数;

所述将控制目标转化为可迭代目标,具体为:

Q*(xt,ut)=r(xt,ut)+γQ*(xt+1,ut+1)

r(xt,ut)=[r1(xt,ut),r2(xt,ut),...,rn(xt,ut)]T

多目标控制步骤,在可迭代目标约束下,求解满足所述可迭代目标的最优控制指令。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江股份有限公司,未经银江股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811615184.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top