[发明专利]一种基于强化学习和D-S证据理论的多传感器数据融合方法有效
| 申请号: | 202110605802.5 | 申请日: | 2021-06-01 |
| 公开(公告)号: | CN113283516B | 公开(公告)日: | 2023-02-28 |
| 发明(设计)人: | 蒋雯;黄方慧;耿杰;邓鑫洋 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06F18/25 | 分类号: | G06F18/25;G06N20/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 证据 理论 传感器 数据 融合 方法 | ||
本发明公开了一种基于强化学习和D‑S证据理论的多传感器数据融合方法,包括以下步骤:步骤一、多传感器数据输入;步骤二、马尔科夫决策模型构建;步骤三、Q‑learning算法实现冲突数据消解;步骤四、采用D‑S证据理论实现多传感器数据融合。本发明采用基于强化学习和D‑S证据理论相结合的方法快速高效地实现多传感器数据融合,通过采用强化学习对多传感器中的冲突数据、故障数据进行实时在线处理,得到冲突消解后的有效多传感器数据,解决了数据高冲突的问题;其次采用D‑S证据理论融合方法能很好的融合不确定多源数据,提升融合性能。
技术领域
本发明涉及多传感器数据融合领域,是一种基于强化学习和D-S证据理论实现多传感器数据融合的方法,实现多传感器数据实时在线有效融合。
背景技术
随着现代科学技术在工业设备上的应用,使得设备复杂化,单一传感器信息已经无法准确体现设备的复杂运行情况。且由于其容易受到环境干扰,会导致获得的数据可能存在故障数据,无法实现对复杂设备的准确决策。而多传感器能将系统的不同特征同时反应出来,将多源数据融合有利于提高系统性能,使结果可信程度高。
多传感器数据融合技术是充分利用不同时间与空间的多传感器数据,对数据进行分析、排序和融合以提高系统性能的重要数据处理技术,在实际生产和应用中起着关键作用。
在多传感器数据融合模型和方法中,D-S证据理论是最为有效的一种可处理不确定信息的方法之一。证据理论还提供了Dempster组合规则,可实现在无先验信息的情况下对证据进行融合。然而,当证据之间存在高度冲突时会产生违反直觉的判断。此外,在实际中,多传感器获得的数据可能存在时间不一致性,导致该方法无法实现对在线数据的实时融合。强化学习通过“试错”的方式进行学习,可实现与外界环境的自主实时交互而无需系统先验信息。因此采用强化学习和D-S证据理论相结合的方法实现对多传感器数据的实时在线融合。
发明内容
为了实现多传感器实时在线数据融合,本发明基于强化学习和D-S证据理论,提供一种智能多传感器数据融合方法,解决了冲突证据和在线实时融合的问题。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤一:多传感器数据输入
将获得的多传感器数据表示为:{D1,D2,…,Di},其中,Di代表第i个传感器的数据,系统中共有i个传感器。此外,传感器的数据表达形式为基本概率指派函数(BasicProbability Assignment,BPA)。若在测量过程中有新的传感器数据加入时,将其写入数据中,表示为:{D1,D2,…,Di,D新}。
步骤二:马尔科夫决策模型构建
采用强化学习对多传感器数据进行自适应冲突消解时,需进行马尔科夫决策(Markov decision process,MDP)模型构建。MDP模型包括系统状态、动作、奖励函数,具体为:
(1)动作集合A:由于多源传感器的信息量不同,在不同的传感器信息下系统应该做出不同的动作选择,使得当存在高冲突信息时,对高冲突信息进行冲突消解,以保证融合结果的准确性有效性,因此将动作集合定义为:A={a1,a2}={保留,删除},系统可以根据实际情况采取保留或者删除的动作;
(2)状态集合S:当融合系统在不同时刻不同传感器信息下采取了某一动作后,系统的状态会发生转移,我们定义当前时刻的融合结果作为系统的状态,即:其中mt和mt+1表示当前时刻采取不同动作的融合结果,at+1表示当前采取的动作。系统状态集合表示为:S={s1,s2,…,st,…}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110605802.5/2.html,转载请声明来源钻瓜专利网。





