[发明专利]图像分类方法和装置在审
| 申请号: | 201810325202.1 | 申请日: | 2018-04-12 |
| 公开(公告)号: | CN109902701A | 公开(公告)日: | 2019-06-18 |
| 发明(设计)人: | 汪涛;郭尚歧;胡晓林;刘祖齐 | 申请(专利权)人: | 华为技术有限公司;清华大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 肖庆武 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标图像 贝叶斯网络 多层 方法和装置 概率集合 图像分类 场分布 图像 模型技术领域 公式建立 后验概率 接收目标 复杂度 计算量 逼近 计算机 分类 概率 发放 学习 | ||
本公开是关于一种图像分类方法和装置,属于学习模型技术领域。该方法包括:接收目标图像;基于预先训练的多层贝叶斯网络,对目标图像进行处理,得到目标图像对应的概率集合,其中,多层贝叶斯网络中的动态发放函数是基于平均场分布公式建立的;根据目标图像对应的概率集合中最大的概率,确定目标图像所属的类别。通过平均场分布公式逼近复杂的不好计算的后验概率公式,在可以取得相似结果的同时,大大降低了计算的复杂度,使得计算机可以实现实际计算。进而,突破了计算量的限制,在实际中可以采用多层贝叶斯网络完成图像的分类操作。
技术领域
本公开是关于学习模型技术领域,尤其是关于一种图像分类方法和装置。
背景技术
在相关技术中可以使用单层贝叶斯网络对输入的图像进行分类,但是分类结果的正确率较低。
在实现本公开的过程中,发明人发现至少存在以下问题:
如果提高网络的复杂度,即采用多层贝叶斯网络进行图像分类,正确率会提高,但是贝叶斯网络所需使用的对图像进行处理的动态发放函数,是由基于贝叶斯定理得到的后验概率公式推导而来,具体在推导过程中需要对后验概率公式进行求偏导等操作。然而,对于多层贝叶斯网络,随着网络内部的层数的增加,后验概率公式本身的计算复杂度呈指数级增加,导致很难对后验概率公式进行求偏导等操作。最终,由于计算量的限制,无法采用多层贝叶斯网络完成图像的分类操作。
发明内容
为了克服相关技术中存在的问题,本公开提供了以下技术方案:
根据本公开实施例的第一方面,提供一种图像分类方法,所述方法包括:
接收目标图像;
基于预先训练的多层贝叶斯网络,对所述目标图像进行处理,得到所述目标图像对应的概率集合,其中,所述预先训练的多层贝叶斯网络中的每个节点分别对应一个WTA(Winner Take All,胜者为王)网络,所述多层贝叶斯网络的神经元为所述多层贝叶斯网络中的WTA网络包括的神经元,所述多层贝叶斯网络中的动态发放函数是基于平均场分布公式建立的,所述概率集合包括所述预先训练的多层贝叶斯网络的输出层中每个神经元的发放脉冲的概率;
根据所述目标图像对应的概率集合中最大的概率,确定所述目标图像所属的类别。
根据本公开实施例提供的方法,接收目标图像;基于预先训练的多层贝叶斯网络,对所述目标图像进行处理,得到所述目标图像对应的概率集合,其中,所述预先训练的多层贝叶斯网络中的每个节点分别对应一个WTA网络,所述多层贝叶斯网络的神经元为所述多层贝叶斯网络中的WTA网络包括的神经元,所述多层贝叶斯网络中的动态发放函数是基于平均场分布公式建立的,所述概率集合包括所述预先训练的多层贝叶斯网络的输出层中每个神经元的发放脉冲的概率;根据所述目标图像对应的概率集合中最大的概率,确定所述目标图像所属的类别。通过平均场分布公式逼近复杂的不好计算的后验概率公式,在可以取得相似结果的同时,大大降低了计算的复杂度,使得计算机可以实现实际计算。进而,突破了计算量的限制,在实际中可以采用多层贝叶斯网络完成图像的分类操作。
在一种可能的实现方式中,所述根据所述目标图像对应的概率集合中最大的概率,确定所述目标图像所属的类别,包括:
在所述输出层的神经元中确定目标神经元,其中,所述目标神经元的发放脉冲的概率是所述概率集合中最大的概率;
基于预设的输出层的神经元与类别的对应关系,确定所述目标神经元对应的目标类别为所述目标图像所属的类别。
在使用的过程中,因为在训练时确定好了输出层的神经元与类别的对应关系,因此,可以直接在输出层的神经元中确定目标神经元,目标神经元的发放脉冲的概率是概率集合中最大的概率。目标神经元可以是一个或者是多个。最后根据目标神经元代表的类别,确定目标图像的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;清华大学,未经华为技术有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810325202.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于哈希算法的大规模影像匹配方法
- 下一篇:目标检测的方法和装置





