[发明专利]一种基于主题模型的动态场景分类方法在审
申请号: | 201410229426.4 | 申请日: | 2014-05-28 |
公开(公告)号: | CN104268546A | 公开(公告)日: | 2015-01-07 |
发明(设计)人: | 刘纯平;林卉;陈宁强;吴扬;季怡;龚声蓉 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 伊美年 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 模型 动态 场景 分类 方法 | ||
技术领域
本发明涉及一种视频处理技术,具体涉及一种基于主题模型的动态场景分类方法。
背景技术
随着科学技术的发展,图像数据的规模变得越来越大,数字图像更是成为信息传播的重要媒体,特别是动态的数字图像。如何快速地对动态图像进行分类管理,这就需要对动态的场景进行分类。互联网上的大量视频信息,对这些数据的智能管理的要求也越来越高。通过对视频场景的自动分类,有助于人们在查找自己感兴趣的数字视频内容时,能够准确、快速定位。例如,若想获取某次森林火灾的视频,我们可以先利用场景分类,先对可以搜寻的视频进行分类,然后在森林火灾这一类场景的视频片段当中寻找特定的目标物体,以达到搜索的目的。
所谓场景分类,即根据图像场景的语义内容对图像进行分类,这不仅包含了人们对一幅图像总体上的认识,而且也提供了图像中出现目标的上下文信息。动态场景分类是指在大量的视频库中,根据视频的语义内容对视频进行分类,进而为图像检索、目标识别的研究提供强有力的基础。
由上述的例子可知,对视频中动态图像的检索依赖于对动态场景的分类,所以对动态场景的分类是基础性的工作,因此动态场景分类也是图像理解与机器视觉中最为基础和关键的研究内容之一。
目前,智能的场景的分类主要有以下几种应用:
1、辅助人工标注。如果大量的数字图像、视频数据能够被自动地分成不同场景类别,人工标注的工作就得到了大大的简化。监控者只要通过观察自动分类后的不同图像场景类型截图,就可以较为清楚地了解容易发生异常事件的场景类型,从而可以更多地关注这个特定的场景类型。这样不仅能够减少人工的工作量,也可以提高监控的准确率。例如,在交通十字路口或高速公路这类人流多、车辆多且复杂的场景里,人流、车流的突然聚拢或者分散情况是一种特殊的场景类型,它们相对于正常的单向人流前进或其他自然 场景来说,发生异常事件的概率要高的多。因此,通过智能的对图像、视频场景分类后,监控人员可以更多的专注此类易发生异常事件的数字图像数据。
2、管理数字图像数据。近年来数字图像视频数据的迅猛增长,对这些数据的智能管理的要求也越来越高。通过对图像、视频场景的自动分类,有助于人们在查找自己感兴趣的数字视频内容时,能够准确、快速定位。同时,通过给同一个数字视频源不同的场景片段标注标签,在以后的搜索和回顾过程中会更加方便快捷,查找视频序列中的固定事件也会变得更加简单。通过对数字视频的场景类别分类,从而实现对这些不同的视频文件的分类管理。
3、为更深层次的数字图像、视频分析提供支持。在计算机视觉领域,场景分类只是众多智能图像、视频分析算法中最为基础和简单的一步,为了对图像、视频场景进行分类,往往需要提取并分析其中的不同特征,这些特征对于后续的视频分析往往是有用的。场景分类也为目标识别与跟踪、行为检测、视频理解之类的计算机视觉任务提供有效的相关信息。例如,当有一个明确的检索目标时,可以先利用场景分类,先对图像或者视频进行分类,然后在同一场景的图像或视频片段当中寻找特定的目标物体,这就使得目标检索变得简化。如果用户没有明确的检索目标,需要根据条件寻找某类图像、视频的结果时,场景分类就显得更为重要,用户可以浏览这一场景的所有图像或者视频,然后再在其中选择需要寻找的结果。
4、为人工智能等其他计算机研究方向提供支持。例如机器人视觉的训练,机器人的智能行走需要给它安装一双“眼睛”。如果能快速对图像场景进行识别,就相当于将外部的环境信息知识提供给了机器人,它就能够利用获取的外部信息快速响应,并自动完成工作。
除了以上这些应用方面外,场景分类正在被越来越多的人关注而且被运用到工业设计的各个方面。通过对场景分类的不断研究,人们在智能分析的领域就能得到更大的进步,而这正是场景理解与分析算法的研究目的所在。
目前,对于动态场景分类的研究方法主要可分为两类。第一类是传统的基于跟踪的动态场景分类方法。这类方法的基本思想是对动态场景内的运动物体进行跟踪,得到它的运动轨迹,通过对运动轨迹的分析实现动态场景分类的目标。首先,对视频进行目标检测与跟踪,检测的结果触发跟踪,再根 据跟踪的轨迹强制检测,随着时间的推移,有效地更新跟踪路线,以提高检测的结果。接着通过对运动轨迹的分析来实现动态场景的分类。但是,当动态场景中运动的物体比较多时,需要跟踪的目标量就会迅猛增长,计算复杂度也直线上升,而且运动目标之间会存在重叠、遮挡的情况,这时的检测效果以及跟踪的效果就会比较差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410229426.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冰箱变温室泡菜制作系统及其电冰箱
- 下一篇:箱胆组件、蒸发器组件和冰箱