[发明专利]一种基于语义映射空间构建的图像检索方法有效

专利信息
申请号: 201410393094.3 申请日: 2014-08-11
公开(公告)号: CN104156433B 公开(公告)日: 2017-05-17
发明(设计)人: 汪萌;杨勋;洪日昌;郭丹;刘奕群;孙茂松 申请(专利权)人: 合肥工业大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 安徽省合肥新安专利代理有限责任公司34101 代理人: 何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语义 映射 空间 构建 图像 检索 方法
【权利要求书】:

1.一种基于语义映射空间的图像检索方法,其特征是按如下步骤进行:

步骤1、学习语义映射空间

步骤1.1、从网络图像数据集中获取训练图像数据集与未标注图像数据集,所述训练图像数据集包括n幅训练图像;所述未标注图像数据集包括m幅未标注图像;获取与所述n幅训练图像相对应的语义概念,并令相同的语义概念用一个索引号来索引,从而获得语义概念集G={g1,g2,...,gγ,...,gc},γ为索引号,γ∈{1,2,…c},c表征所述语义概念的个数,c≤n;

步骤1.2、提取所述训练图像数据集和所述未标注图像数据集中每幅训练图像和未标注图像的高维特征向量,从而获得高维特征向量集X={x1,...,xn,xn+1,...,xn+m};d表示所述训练图像和未标注图像的特征维数;

步骤1.3、利用式(1)获得任意两个语义概念gα和gβ之间的距离Dα,β,从而利用式(2)获得在所述语义概念集G中任意两个语义概念gα和gβ之间距离Dα,β所组成的语义距离矩阵

<mrow><msub><mi>D</mi><mrow><mi>&alpha;</mi><mo>,</mo><mi>&beta;</mi></mrow></msub><mo>=</mo><mfrac><mrow><mi>m</mi><mi>a</mi><mi>x</mi><mrow><mo>(</mo><mi>log</mi><mi> </mi><mi>f</mi><mo>(</mo><msub><mi>g</mi><mi>&alpha;</mi></msub><mo>)</mo><mo>,</mo><mi>log</mi><mi> </mi><mi>f</mi><mo>(</mo><msub><mi>g</mi><mi>&beta;</mi></msub><mo>)</mo><mo>)</mo></mrow><mo>-</mo><mi>log</mi><mi> </mi><mi>f</mi><mo>(</mo><mrow><msub><mi>g</mi><mi>&alpha;</mi></msub><mo>,</mo><msub><mi>g</mi><mi>&beta;</mi></msub></mrow><mo>)</mo></mrow><mrow><mi>log</mi><mi> </mi><mi>K</mi><mo>-</mo><mi>m</mi><mi>i</mi><mi>n</mi><mrow><mo>(</mo><mi>log</mi><mi> </mi><mi>f</mi><mo>(</mo><msub><mi>g</mi><mi>&alpha;</mi></msub><mo>)</mo><mo>,</mo><mi>log</mi><mi> </mi><mi>f</mi><mo>(</mo><msub><mi>g</mi><mi>&beta;</mi></msub><mo>)</mo><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>

式(1)中:α、β∈{1,2,…c}分别表示语义概念gα和gβ的索引号;f(gα)表示包含语义概念gα的训练图像个数,f(gβ)表示包含语义概念gβ的训练图像个数;f(gα,gβ)表示既包含语义概念gα又包含语义概念gβ的训练图像个数;K表示所述网络图像数据集中所有网络图像的个数;

步骤1.4、定义语义概念gα在所述语义映射空间上的映射为语义概念原型由每一个语义概念所对应的语义概念原型构成语义概念原型矩阵P,

1.4.1、利用式(3)计算矩阵

<mrow><mover><mi>D</mi><mo>&OverBar;</mo></mover><mo>=</mo><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mrow><mo>(</mo><mi>I</mi><mo>-</mo><mfrac><mn>1</mn><mi>c</mi></mfrac><msup><mn>11</mn><mi>T</mi></msup><mo>)</mo></mrow><mi>D</mi><mrow><mo>(</mo><mi>I</mi><mo>-</mo><mfrac><mn>1</mn><mi>c</mi></mfrac><msup><mn>11</mn><mi>T</mi></msup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>

式(3)中:为单位矩阵;表示全为1的列向量;

1.4.2、按照的分解形式对矩阵进行分解,获得矩阵V和Λ;Λ为特征值对角矩阵,V为对应的特征向量矩阵;

1.4.3、采用式(4)获得语义概念原型矩阵P,从而获得每一个语义概念所对应的语义概念原型p1,p2,...,pα,...,pc

<mrow><mi>P</mi><mo>=</mo><msqrt><mi>&Lambda;</mi></msqrt><mi>V</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>

步骤1.5、利用式(5)学习图像映射矩阵W:

<mrow><mi>W</mi><mo>=</mo><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>p</mi><msub><mi>y</mi><mi>i</mi></msub></msub><msubsup><mi>x</mi><mi>i</mi><mi>T</mi></msubsup><mo>)</mo></mrow><msup><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>x</mi><mi>i</mi></msub><msubsup><mi>x</mi><mi>i</mi><mi>T</mi></msubsup><mo>+</mo><mi>&lambda;</mi><mi>I</mi><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>

式(5)中:表示第i幅训练图像的高维特征向量;yi∈{1,2,…,c}表示第i幅训练图像的语义概念的索引号;λ为正则化参数;

由所述语义概念原型矩阵P和图像映射矩阵W获得所述语义映射空间

步骤2、利用式(6)获得所述未标注图像数据集中任一未标注图像所对应的语义概念的索引号θ,从而估计每个未标注图像的语义概念:

<mrow><mi>&theta;</mi><mo>=</mo><mi>arg</mi><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mrow><mi>&theta;</mi><mo>&Element;</mo><mo>{</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>c</mi><mo>}</mo></mrow></munder><mo>|</mo><mo>|</mo><msub><mi>p</mi><mi>&theta;</mi></msub><mo>-</mo><msub><mi>Wx</mi><mi>t</mi></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>

式(6)中:xt表示所述未标注图像数据集中任一未标注图像的高维特征向量;t∈(n+1,…,n+m);

步骤3、将语义概念gθ所对应的未标注图像的高维特征向量以及未标注图像的高维特征向量组成向量集{xθ1,xθ2,...,xθl},并将所述向量集{xθ1,xθ2,...,xθl}按照的大小进行升序排列;j∈{1,2,…,l};

步骤4、输入待检索的文本查询词,找到所述文本查询词在语义映射空间中所对应的语义概念,并按照步骤3进行升序排列后,返回所述语义概念所对应的图像。

2.根据权利要求1所述的基于语义映射空间的图像检索方法,其特征是,当有新的语义概念加入到语义映射空间时,所述步骤1的语义映射空间是按如下步骤进行更新:

步骤2.1、利用式(7)获得新的语义概念gc+1所对应的语义概念原型pc+1

<mrow><msub><mi>p</mi><mrow><mi>c</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><mi>arg</mi><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mi>p</mi></munder><munderover><mo>&Sigma;</mo><mrow><mi>&theta;</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msup><mrow><mo>(</mo><mo>|</mo><mo>|</mo><mi>p</mi><mo>-</mo><msub><mi>p</mi><mi>&theta;</mi></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msup><mrow><mo>(</mo><msub><mi>D</mi><mrow><mi>c</mi><mo>+</mo><mn>1</mn><mo>,</mo><mi>&theta;</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>

式(7)中:Dc+1,θ为语义概念gc+1和语义概念gθ之间的语义距离,θ∈{1,2,…,c};

并利用式(8)获得新的语义概念原型矩阵P*

P*=P∪pc+1(8)

式(8)中:更新后得到的语义概念原型矩阵P*={p1,p2,…pc,pc+1};

步骤2.2、利用式(9)获得新的图像映射矩阵W*

<mrow><msup><mi>W</mi><mo>*</mo></msup><mo>=</mo><mrow><mo>(</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msub><mi>p</mi><msub><mi>y</mi><mi>i</mi></msub></msub><msup><msub><mi>x</mi><mi>i</mi></msub><mi>T</mi></msup><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>q</mi></munderover><msub><mi>p</mi><mrow><mi>c</mi><mo>+</mo><mn>1</mn></mrow></msub><msubsup><mi>x</mi><mi>k</mi><mrow><mo>&prime;</mo><mi>T</mi></mrow></msubsup><mo>)</mo></mrow><msup><mrow><mo>(</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msub><mi>x</mi><mi>i</mi></msub><msup><msub><mi>x</mi><mi>i</mi></msub><mi>T</mi></msup><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>q</mi></munderover><msubsup><mi>x</mi><mi>k</mi><mo>&prime;</mo></msubsup><msubsup><mi>x</mi><mi>k</mi><mrow><mo>&prime;</mo><mi>T</mi></mrow></msubsup><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow>

式(9)中:yi为第i幅训练图像所对应的语义概念索引号;x′k为所述新的语义概念gc+1对应的第k幅图像的高维特征向量,k∈{1,2,…,q};由所述新的语义概念原型矩阵P*和新的图像映射矩阵W*获得更新的所述语义映射空间

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410393094.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top