[发明专利]一种基于能量模型的图像语义标注方法有效
申请号: | 201910074245.1 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109657691B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 田东平 | 申请(专利权)人: | 宝鸡文理学院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06T7/143;G06F16/958 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 李振瑞 |
地址: | 721016*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 能量 模型 图像 语义 标注 方法 | ||
本发明属于计算机应用技术领域,公开了一种基于能量模型的图像语义标注方法,包括:使用马尔科夫随机场方法分割图像,得到两组图像数据;将图像数据送入图像识别层进行初步识别;将初步识别的结果送入信息提取层进行特征信息提取并进行编码;将编码送入归纳层进行能量模型建立;建立能量模型,将两组编码进行比较分析、运算,直到能量最小;输出图片标注信息结果。本发明分离了开发人员的关注,提高了系统可维护性、避免了人工分割图像、对称分割图像的语义单一问题,将图像的语义理解分为信息提取和归纳,较好地解决了“语义鸿沟”问题。
技术领域
本发明属于计算机应用技术领域,尤其涉及一种基于能量模型的图像语义标注方法。
背景技术
目前,业内常用的现有技术是这样的:随着数字影像技术与互联网技术迅速发展,互联网上有着数以百亿计的图像,进行图像的语义标记是搜索引擎快速检索、图像分类识别与存储的关键技术。目前,商业化图像搜索引擎都是以文本关键字的形式来查询,其关键字主要依靠人工标注及Web文本,工作量巨大且缺乏一定的客观性。此外,人工和Web文本因为“语义鸿沟”的原因,都不能很好匹配用户的检索意图。基于以上应用缺陷,图像自动标注可以改善目前的检索困境。能量模型(EnergybasedModel,EBM)是一种具有普适意义的模型,可以说它是一种模型框架,在它的框架下囊括传统的判别模型和生成模型,图变换网络,条件随机场,最大化边界马尔科夫网络以及一些流形学习的方法等。EBM通过对变量的每个配置施加一个有范围限制的能量来捕获变量之间的依赖关系。EBM有两个主要的任务,一个是推断(Inference),它主要是在给定观察变量的情况,找到使能量值最小的那些隐变量的配置;另一个是学习(Learning),它主要是寻找一个恰当的能量函数,使样本中正确的输入输出的能量比错误的输入输出的能量低。基于能量的模型(EBM)把我们所关心变量的各种组合和一个标量能量联系在一起。玻尔兹曼机(Boltzmann Machine,BM)是一种特殊形式的对数线性的马尔科夫随机场(Markov Random Field,MRF),即能量函数是自由变量的线性函数。通过引入隐含单元,我们可以提升模型的表达能力,表示非常复杂的概率分布。限制性玻尔兹曼机(RBM)进一步加一些约束,在RBM中不存在可见单元与可见单元的链接,也不存在隐含单元与隐含单元的链接。
综上所述,现有技术存在的问题是:现有人工标注及Web文本,工作量巨大且缺乏一定的客观性。
发明内容
针对现有技术存在的问题,本发明提供了一种基于能量模型的图像语义标注方法。
本发明是这样实现的,一种基于能量模型的图像语义标注方法,所述基于能量模型的图像语义标注方法包括:
第一步,使用马尔科夫随机场方法分割图像,对分割结果进行进一步优化,提高分割的精确性,得到两组图像数据;将图像数据送入图像识别层进行初步识别;
将MRF图像分割方法应用于图像处理领域,该方法空间约束性强,能够有效地描述空间像素与像素之间的依赖关系。图像分割的建模过程可概述如下
平面上的点集记为S,即S={s1,s2,…,sM×N},其中[M,N]表示图像尺寸。将图像分割问题本质表述为图像标记问题,即将图像每个像素点的分类标号组成的标号场记为ω,
第二步,将初步识别的结果送入信息提取层进行特征信息提取并进行编码;将编码送入归纳层进行能量模型建立;
信息提取模块的输入是经过信息采集模块处理后的HTML文件,输出是结构化的人物属性信息。信息提取主要分为两个部分:半结构化信息提取和自由文本信息提取。输入的每一个HTML文件都要经过以上两个部分的信息提取,输出的结构化信息作为信息聚合模块的输入;
第三步,建立能量模型,将两组编码进行比较分析、运算,直到能量最小;输出图片标注信息结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宝鸡文理学院,未经宝鸡文理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910074245.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序