[发明专利]基于强化学习的智能决策方法及系统有效
申请号: | 202110403205.4 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113204916B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 李启娟 | 申请(专利权)人: | 特斯联科技集团有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08 |
代理公司: | 北京春江专利商标代理事务所(普通合伙) 11835 | 代理人: | 向志杰 |
地址: | 100027 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 智能 决策 方法 系统 | ||
本发明涉及一种基于强化学习的智能决策系统,所述系统包括:强化学习模块,用于将每一份学习数据对应的丢失商品的数量的倒数作为对卷积神经网络进行强化学习的奖励信号进行强化学习,以分时逐份完成固定数量的多份学习数据的强化学习;数量解析模块,用于采用强化学习后的卷积神经网络确定为使得强化学习后的卷积神经网络的输出层的单个输出数据即丢失商品的数量最少所需要的输入数据即同一超市内相等面积的设定数量的多个分区域应该分别部署的多个安保人员数量。本发明还涉及一种基于强化学习的智能决策方法。通过本发明,能够采用基于强化学习的卷积神经网络完成对同一超市内海量视频数据以及海量商品录入数据之间的对应关系的建模。
技术领域
本发明涉及智慧大脑领域,尤其涉及一种基于强化学习的智能决策方法及系统。
背景技术
随着技术的发展和城市数据建设的跟进,大数据对于城市管理发展的影响日益显现,越来越多的城市通过挖掘数据金矿帮助城市发展决策管理。在城市运行和经济发展中,大数据被视为支撑城市发展的智慧大脑。城市的管理和运营需要科学决策,涓滴汇流而来的数据,正在成为城市管理者的有效参考。市政、警务、消防、交通、通信、商业被融合打通,汇集在统一的大数据平台上,并在对海量数据进行分析后,形成智慧应用。
然而,大数据的成熟应用尚需时日,从目前来看,应用大数据,突破瓶颈依然需要时间,其中重点之一,就是对海量数据进行挖掘时如何建模。由于数据挖掘的建模非常繁琐,需要花费大量时间,无法一蹴而就。目前有了数据只是第一步,寻找数据维度之间的相关性,总结规律,需要经历很长时间,还需要通过实践来检验算法模型,同时适应新数据的涌入,发展大数据没有捷径,需要一砖一瓦累积起来。
例如,在城市的超市管理方面,遍布超市各个区域的摄像部件不间断拍摄了大量的视频数据,而超市每一段时间内的丢失商品数量也在持续的人工统计或者自动统计中,但是,这两项不同类型的海量数据之间的数据关联性仍缺乏针对性的数据挖掘方案,导致反应对应关系的智能化模块一直无法有效建立。
发明内容
为了解决上述问题,本发明提供了一种基于强化学习的智能决策方法及系统,采用卷积神经网络完成同一超市内海量视频数据以及海量商品录入数据之间的对应关系的建模,尤为重要的是,将预设时间长度内的丢失商品数量的倒数作为对所述卷积神经网络进行强化学习的奖励信号以完成对所述卷积神经网络的强化学习操作,从而为每一超市设定时刻为保证最少商品损失所需派遣到各个区域的安保人员数量提供人工智能解析方案。
为此,本发明至少需要具备以下三处关键的发明点:
(1)利用强化学习后的深度卷积神经网络对不同面积的超市在设定时刻派遣到各个区域的各个安保人员数量进行解析,以保证派遣后的超市商品丢失数量最少;
(2)为不同超市建立不同的基于强化学习的深度卷积神经网络,超市面积越大,均匀划分为固定面积的各个区域的数量越多,所述深度卷积神经网络的输入层的输入数据越多、隐含层的数量越多,从而为不同面积超市提供相同智能化水平的人工智能安防机制;
(3)将每一份学习数据对应的丢失商品的数量的倒数作为对深度卷积神经网络进行强化学习的奖励信号对深度卷积神经网络进行强化学习操作,从而保证了深度卷积神经网络的学习效果。
根据本发明的第一方面,提供了一种基于强化学习的智能决策系统,所述系统包括:
网络建立模块,用于建立卷积神经网络,所述卷积神经网络的输入层的设定数量的多个输入数据为同一超市内相等面积的设定数量的多个分区域分别部署的多个安保人员数量,所述卷积神经网络的输出层的单个输出数据为所述超市在完成上述部署后预设时间长度范围内的丢失商品的数量;
数据采集模块,用于采集固定数量的多份学习数据,每一份学习数据为所述同一超市内相等面积的设定数量的多个分区域在某一个历史时刻分别部署的多个安保人员数量,所述卷积神经网络的输出层的单个输出数据为所述历史时刻后预设时间长度范围内的丢失商品的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联科技集团有限公司,未经特斯联科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110403205.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于CPS的PHM设计方法
- 下一篇:一种彩棉保暖面料的制备方法