[发明专利]一种基于不完整文本描述的特定行人检索方法有效
| 申请号: | 201510153983.7 | 申请日: | 2015-04-02 |
| 公开(公告)号: | CN104715071B | 公开(公告)日: | 2017-10-03 |
| 发明(设计)人: | 胡瑞敏;叶茫;梁超;柳东静;王正;陈军;刘俊 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 薛玲 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 完整 文本 描述 特定 行人 检索 方法 | ||
技术领域
本发明属于监控视频检索技术领域,涉及一种行人检索方法,尤其涉及一种基于不完整文本描述的特定行人检索方法。
背景技术
传统的特定行人检索方法(行人重识别)都是基于行人的视觉影像,但在更加实际的视频监控应用中,只能获得一些文本的描述,比如目击者向警察这样描述犯罪嫌疑人:“一个背着双肩包身穿红色休闲服的年轻女士”。这类行人特征描述很显然是不完整的,传统的行人检索方法对此便无能为力。
在上述情况下,仅依赖于给定的属性来解决特定行人检索问题是至关重要的。在[文献1]中,这些特定属性主要从口头描述中抽象而来。相关的行人重识别研究也提出了一些基于属性的方法。Layne在[文献2]中使用了一种通过筛选和加权中层语义属性的方法来描述行人;Liu在[文献1]中提出了ARLTM(属性受限的潜在主题模型),将目标编码进语义查询;Nguyen在[文献3]提出基于属性间关系的方法,该方法利用属性间的关系来改善属性检测的结果。然而上述的方法不适合本文描述的问题,因为对于该问题,用于检索的图片信息是无法获得的。因此需要研究一种新方法来解决此问题。
另外,正如[文献4]所描述的那样,用户提供的属性经常是不完整的。这些不完整的属性很可能导致行人检索应用性能倒退(参见[文献1])。而且,从更广泛的层面上来讲,这种属性补全问题主要采用传统的TBIR(基于标签的图片检索)。在监控视频检索领域,这类问题是被忽视了的。
[文献1]X.Liu,M.Song,Q.Zhao,D.Tao,and etal.Attribute-restricted latent topic model forpersonre-identification.In PR,2012.
[文献2]R.Layne,T.M.Hospedales,S.Gong,and Q.Mary.Person re-identification byattributes.In BMVC,2012.
[文献3]N.N.B,N.V.H,D.T.N,and et al.Attrel:An approach to person re-identification byexploitingattribute relationships.In MMM,2015.
[文献4]L.Wu,R.Jin,and A.Jain.Tag completion for imageretrieval.In PAMI,2013.
发明内容
为了解决上述的技术问题,本发明提供了一种基于不完整文本描述的特定行人检索方法。
本发明所采用的技术方案是:一种基于不完整文本描述的特定行人检索方法,由两部分组成:离线处理和在线处理;其特征在于:所述的离线处理包括对图像库中的训练图片训练属性分类器和距离尺度学习;所述的在线处理首先把用户针对查询文本进行的不完整的描述转化为一个初始属性向量,然后采用线性稀疏重建的方法将初始属性向量重建成一个完整的向量最后使用基于属性的尺度学习得到的矩阵M进行距离计算;使用训练得到的属性分类器提取图像库中的测试图片属性向量,使用向量图像库中测试图片的属性向量和矩阵M,获得查询文本与图像库中的测试图片的距离,根据得到的距离进行升序排列,即可相应的对图像库中的测试图片进行排名。
作为优选,所述的离线处理,预先计算测试图片的视觉特征向量和属性向量,其中将尺度学习引入到属性向量的距离计算;具体实现包括以下子步骤:
步骤1.1:采用线性SVM来训练属性分类器,训练数据包含两部分:视觉特征向量和已标签化的属性;对于每一种属性,都会训练一个分类器,其中所有包含该属性的样本视为正样本,而其余的则视为负样本;
步骤1.2:在训练分类器的基础上,提取测试图片的属性向量;因为分类器对每个属性的输出值是从负无穷到正无穷,所以使用logistic函数将输出值变换到(0,1)区间内;所述的logistic函数为:
其中,x为分类器的原始输出,y为变换值,表明拥有该属性的可能性;
步骤1.3:基于属性的尺度学习;给定一对样本xi,xj(xi,xj∈Rd),它们之间的马氏距离定义如下:
其中,M≥0,并且是一个半正定矩阵;Rd表示实数空间;
定义马氏距离的矩阵M如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510153983.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:锗硅异质结晶体管的大信号模型方法
- 下一篇:一种搜索推荐词的处理方法和装置





