[发明专利]对图像中的对象进行识别的方法和装置在审
申请号: | 201610268979.X | 申请日: | 2016-04-27 |
公开(公告)号: | CN107316045A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 吴鲁 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 吴秋明 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 中的 对象 进行 识别 方法 装置 | ||
技术领域
本发明属于图像智能识别领域,具体的说,涉及一种对图像中的对象进行识别的方法和装置,能够以更快的速度对图像中的对象精确地进行识别。
背景技术
近年来,图像识别技术得到迅速的发展及广泛应用。这是一种基于已知的识别物体库,利用计算机或嵌入式设备分析图像,进而利用识别物体特征来检测出识别物体的一门技术。具体地,利用各种识别物体的特征形成算法,让计算机对识别物体进行学习,并利用分类算法,将物体识别或检测出来的技术。
在实际的检测中,由于识别物体(对象)的情况为未知,所以会采用可变尺寸滑动框对整个图像进行滑动判别,从而找到识别物体。
在实际检测中,由于大量进行滑动框的滑动以及尺寸的缩放,会消耗大量的计算时间,因此对图像进行识别的速度较慢。
发明内容
为了克服现有技术的上述缺陷提出了本发明。因此,本发明的目的之一是提出一种对图像中的对象进行识别的方法和装置,能够以更快的速度对图像中的对象精确地进行识别。
为了实现上述目的,根据本发明,提出了一种对图像中的对象进行识别的方法,包括:采用大尺寸的感受野和大尺寸的像素移动步长,通过对象数据样本进行神经元网络模型训练,获得用于判别所述对象是否存在于该感受野的第一神经元网络模型;采用大尺寸的感受野和大尺寸的像素移动步长,通过对象边缘数据样本进行神经元网络模型 训练,获得用于判别所述对象是否存在于该感受野的第二神经元网络模型;采用小尺寸的感受野和小尺寸的像素移动步长,通过对象数据样本进行神经元网络模型训练,获得用于判别所述对象是否存在于该感受野的第三神经元网络模型;将所述图像分割为多个区域;对分割后的所述图像的多个区域,分别应用所述第一神经元网络模型和所述第二神经元网络模型,对每个区域中的所述对象的存在与否进行判别,对所述第一神经元网络模型的判别结果和所述第一神经元网络模型的判别结果进行或运算来得到最终的判别结果,并对判别为存在所述对象的各区域进行区域聚类;以及对进行了区域聚类后的区域,应用所述第三神经元网络模型,对所述对象的存在与否进行滑动窗判别并对判别为存在所述对象的滑动窗进行区域聚类,从而识别出所述对象。
优选地,将所述图像分割为多个区域是通过四叉树模型来进行的。
优选地,所述第一神经元网络模型、所述第二神经元网络模型和所述第三神经元网络模型均采用局部连接卷积神经元网络模型。
优选地,所述滑动窗判别采用可变尺寸滑动窗判别。
优选地,所述滑动窗判别采用固定尺寸大步长滑动窗判别。
优选地,所述对象边缘数据样本是通过对所述对象进行边缘计算而从所述对象数据样本中获得的。
根据本发明,还提出了一种对图像中的对象进行识别的装置,包括:采用大尺寸的感受野和大尺寸的像素移动步长,通过对象数据样本进行神经元网络模型训练,获得用于判别所述对象是否存在于该感受野的第一神经元网络模型的单元;采用大尺寸的感受野和大尺寸的像素移动步长,通过对象边缘数据样本进行神经元网络模型训练,获得用于判别所述对象是否存在于该感受野的第二神经元网络模型的单元;采用小尺寸的感受野和小尺寸的像素移动步长,通过对象数据样本进行神经元网络模型训练,获得用于判别所述对象是否存在于该感受野的第三神经元网络模型的单元;将所述图像分割为多个区域的单元;对分割后的所述图像的多个区域,分别应用所述第一神经元网络模型和所述第二神经元网络模型,对每个区域中的所述对象的存在与否进行判别,对所述第一神经元网络模型的判别结果和所述第一神经 元网络模型的判别结果进行或运算来得到最终的判别结果,并对判别为存在所述对象的各区域进行区域聚类的单元;以及对进行了区域聚类后的区域,应用所述第三神经元网络模型,对所述对象的存在与否进行滑动窗判别并对判别为存在所述对象的滑动窗进行区域聚类,从而识别出所述对象的单元。
根据本发明,先采用针对大尺寸的第一神经元网络模型和第二神经元网络模型来进行初步判别,再采用针对小尺寸的第三神经元网络模型进行进一步地判别,能够以更快的速度对图像中的对象精确地进行识别。
附图说明
通过参考附图的详细描述,本发明的上述目的和优点将变得更清楚,其中:
图1是示出了根据本发明的对图像中的对象进行识别的装置的结构框图。
图2是示出了根据本发明的对图像中的对象进行识别的方法的第一实施例的流程图。
图3是示出了根据本发明的对图像中的对象进行识别的方法的第二实施例的流程图。
图4是通过四叉树模型将图像分割为4×4的区域的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610268979.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:相似用户识别方法和装置
- 下一篇:图像处理装置、图像处理方法以及存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序