[发明专利]一种图像识别方法及装置有效
申请号: | 201911387352.6 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111144498B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 黄泽元;姚瑶 | 申请(专利权)人: | 深圳集智数字科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/80;G06N3/047;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 | ||
本申请实施例公开了一种图像识别方法及装置,在将待识别图像输入训练完成的神经网络,可以得到神经网络的输出结果,根据输出结果可以确定待识别图像的当前状态,其中神经网络基于训练图像和训练图像的状态标签训练得到,训练图像可以包括融合图像,融合图像可以基于多个原始图像融合得到,融合图像的状态标签可以由融合得到融合图像的多个原始图像的状态标签融合得到,融合图像的状态标签可以包括多个状态的概率值,即使待识别图像为两个状态的中间状态时,神经网络也能够分别对这两个状态的特征进行分析,得到最终的输出结果,因此提高了图像识别的准确性。
技术领域
本发明涉及计算机领域,特别是涉及一种图像识别方法及装置。
背景技术
目前,可以通过对图像进行识别得到图像中的特征,进而得到图像拍摄时期实际存在的场景的特征。在一些情况下,实际存在的场景可能随着时间的变化而有所改变,这样场景中的特征也随着时间的改变有着渐变的特征,在一个图像中可能同时存在多个相邻状态的特征,这无疑对图像状态的识别的准确性造成一定的影响。
举例来说,在建筑工地中铝膜式建筑通常需要五道工序:水平钢筋绑扎阶段、混凝土浇筑阶段、墙柱竖向钢筋绑扎阶段、竖向模板安装阶段、水平模板梁板安装阶段,通过对建筑工地进行拍摄,以及对拍摄得到的图像进行识别,可以判断出当前建筑工地所处的阶段。然而,各个阶段之间存在过渡阶段,此时拍摄得到的图像具有至少两个阶段的特征,无法准确得到当前的状态。
对于这种同时存在至少两个相邻状态的特征的图像,如何进行图像识别是一个重要的问题。
发明内容
为解决上述技术问题,本申请实施例提供一种图像识别方法及装置,提高图像识别的准确性。
本申请实施例提供了一种图像识别方法,包括:
将待识别图像输入训练完成的神经网络,得到所述神经网络的输出结果;所述神经网络基于训练图像和所述训练图像的状态标签训练得到,所述训练图像包括融合图像,所述融合图像基于多个原始图像融合得到,所述融合图像的状态标签由所述多个原始图像的状态标签融合得到,所述融合图像的状态标签包括多个状态的概率值;
根据所述输出结果确定所述待识别图像的当前状态。
可选的,所述多个原始图像具有对应相邻状态的状态标签。
可选的,所述训练图像还包括所述重置图像,所述重置图像为所述原始图像,所述重置图像的状态标签包括所述原始图像的状态对应的第一预设概率,以及所述原始图像的状态的相邻状态对应的第二预设概率。
可选的,所述第一预设概率大于或等于0.7,所述第二预设概率小于或等于0.3。
可选的,所述训练图像还包括原始图像和所述原始图像的增强图像,所述增强图像通过对所述原始图像进行以下至少一项处理后得到:翻转、旋转、随机擦拭、弹性扭曲、错切变换、随机亮度、随机对比度、直方图均衡、沿预设角度倾斜、添加高斯噪声。
可选的,所述神经网络通过以下方式训练得到:
将所述训练图像输入神经网络,得到所述神经网络输出的训练结果;
根据所述训练结果和所述训练图像的状态标签得到所述神经网络的损失函数;
调整所述神经网络的参数以最小化所述损失函数。
可选的,所述根据所述输出结果确定所述待识别图像的当前状态,包括:
若所述输出结果中存在目标状态的概率大于或等于概率阈值,则确定所述待识别图像的当前状态为目标状态。
可选的,所述待识别图像为对目标对象进行拍摄得到的,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳集智数字科技有限公司,未经深圳集智数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911387352.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序