[发明专利]基于神经网络的视频兴趣区域和显著目标提取与定位系统有效
| 申请号: | 201810381362.8 | 申请日: | 2018-04-25 |
| 公开(公告)号: | CN108875555B | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 王常勇;周瑾;韩久琦;柯昂;徐葛森;张华亮 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/25;G06N3/06;G06T7/136 |
| 代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 张玉梅 |
| 地址: | 100036*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 神经网络 视频 兴趣 区域 显著 目标 提取 定位 系统 | ||
本发明公开了一种基于神经网络的视频兴趣区域和显著目标提取与定位系统,包括:系统参数初始化模块,其用来设定或随机生成初始值;脉冲神经网络构建模块,其用来自动生成多尺度脉冲神经网络;视频信息读入模块,其用来将视频读入为连续数据流;视频帧描述模块,其用来将连续数据流生成为视频帧描述;超像素区域分割模块,其用来将每个视频帧分割为不同尺度的视频帧区域;区域显著值计算模块,其用来计算不同尺度的视频帧区域的显著值分布图;不同尺度显著值融合模块,其用来对若干显著值分布图进行融合;以及结果输出模块,其用来输出最终显著值分布图并。该系统可以提高视频数据的利用率。
技术领域
本发明涉及于视频处理和分析领域,特别涉及一种基于多尺度脉冲神经网络的视频兴趣区域和显著目标提取与定位系统。
背景技术
监控、摄像、互联网等技术的飞速进步和普及,产生了海量视频信息,特别是共享经济、人工智能等概念的普及,使得视频信息快速智能分析日渐成为目前机器视觉与智能系统研究与开发的热点,视频信息的分析研究成果可为现代工业、商业提供重要保障,也为艺术、交通、娱乐等领域技术的革新和普及提供了可能。
随着枪式、球式、便携式摄像头等各类型视频采集设备的普及,视频信息的获取成本快速下降,大大降低了视频信息采集与分析的门槛,特别是在人流量大的公共场所,如车站、商场等,各类视频采集设备不断地在产生包含行人、物体、场景等对象各类信息的视频数据。尤其是当前互联网技术和共享精神的普及,可由视频得到的各类信息数量正在以前所未有的速度飞速增长。以32位真彩色编码的1080p视频为例,一段1分钟的短视频在未压缩之前的大小就超过了6G,巨大的数据量对处理和分析系统的实时性和准确性要求极高。一个高速、稳定的视频处理和分析系统可以加快视频中有用信息的甄别速度、提高视频的有效利用率、减少人员不必要的负担,进而为突发事件、群体事件、犯罪行为等提供重要信息支持,节省宝贵时间。此外,一个快速、智能的视频处理和分析系统可以准确从非结构化的视频数据中提取出感兴趣的区域和目标,进而为视频编辑、辅助驾驶、商品推荐、目标锁定等任务减少时间和人力成本,并提高下游系统的分析准确率,为革新多种惠及人民群众的使用技术提供便捷之路。
但是,由于视频是由时间序列上连续的图像流组成,因此传统的视频处理和分析系统多采用成熟的图像处理技术。然而,图像分析系统对实时性的要求较低,处理技术中经常包含过多复杂特征,这些特征的计算需要巨大的计算量,严重减缓了系统的运行速度,不适合于视频等对时效性要求较高的任务。同时,利用简单特征的经典图像处理算法多在一个固定尺度下采用像素密度、颜色分布等空域和谱域信息来提取图像中的显著目标,并未考虑不同尺度下物体的特征变化情况。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种基于多尺度脉冲神经网络的视频兴趣区域和显著目标提取与定位系统,可实时地对获取到的场景视频进行快速处理和分析,有效降低海量视频信息判读的成本,提高视频数据的利用率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810381362.8/2.html,转载请声明来源钻瓜专利网。





