[发明专利]基于在线学习的潜在语义跨媒体哈希检索方法在审
申请号: | 201810429547.1 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108595688A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 姚涛;王刚;苏庆堂;王洪刚;张小峰;岳峻 | 申请(专利权)人: | 鲁东大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264025 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线学习 模态 跨媒体检索 哈希函数 目标函数 目标数据 潜在语义 新数据 图像 哈希 排序 文本 潜在语义空间 查询数据 迭代优化 汉明距离 计算测试 离散标签 提取数据 文本数据 训练过程 异构数据 测试集 查询集 哈希码 数据集 训练集 求解 映射 构建 升序 检索 测试 返回 更新 | ||
1.一种基于在线学习的跨媒哈希体检索方法,其特征在于,该方法包括以下步骤:
步骤1:从网络上搜集图像、文本数据对,构建跨模态检索数据库,提取数据库中图像和文本数据的特征并去均值,将数据集分为训练集和测试集;
步骤2:将数据的离散标签映射到连续的潜在语义空间,并保持基于此空间的数据间相似性构建目标函数;
步骤3:利用基于在线学习的迭代优化算法求解目标函数,使得当有新数据产生时,只利用新数据更新哈希函数;
步骤4:根据测试集中数据的模态,利用相应模态哈希函数将数据映射到汉明空间;
步骤5:将测试集中某一模态(例如:图像)的数据作为查询集,另一模态(例如:文本)的数据作为目标数据集;
步骤6:计算查询集中一个数据与目标数据集中所有数据的汉明距离,并按升序排序,返回前个数据作为跨媒体检索结果。
2.根据权利要求1所述的基于在线学习的监督跨媒体哈希检索方法,其特征在于,所述步骤1包括:
1)利用网络收集图像和文本数据,并且使图像和文本数据是一一对应的;
2)对所有图像数据提取其SIFT特征点,并对特征点进行K-Means聚类,把聚类中心作为视觉单词;然后把所有特征点量化到距离最近的视觉单词,最后与对文本数据的处理相同,利用词频-逆文件频率的方法生成图像的特征表示,图像数据最终被表示为,其中为图像数据表示的维数,为训练数据库文本数据的数量;
3)对所有文本数据利用词袋模型生成特征表示,并利用词频-逆文件频率的方法对每个单词加权,最终所有文本数据被表示为,其中为文本表示的维数;
4)对生成的图像和文本特征表示进行去均值处理;
5)按照一定比例,将数据集划分为训练集和测试集。
3.根据权利要求1所述的基于在线学习的监督跨媒体哈希检索方法,其特征在于,所述步骤2中,包括以下步骤:
1)基于所述的训练集中图像和文本数据的特征建立目标函数;
2)所述目标函数,定义如下:
其中,为所有数据的标签矩阵,和为映射矩阵,为数据的哈希码,分别表示图像和文本模态的哈希函数,和为待定权重参数,表示F-范数。
4.根据权利要求1所述的基于在线学习的监督跨媒体哈希检索方法,其特征在于,所述步骤3中,包括以下步骤:
1)把训练数据库中的数据按照收集时间顺序分成个数据块,模拟数据随着时间的推移,新数据不断产生,初始训练集只包含第一个数据块的数据,然后每次向训练集添加一个数据块;
2)设定阈值和最大迭代次数,只要满足相邻两次迭代目标函数值之差大于阈值或迭代次数小于最大迭代次数,执行3)-- 7);
3)固定、、和求解:当第()次数据产生时,新图像和文本数据分别用,表示,新数据的标签用表示,新数据的哈希码用表示,已有图像和文本数据用,表示,已有数据的标签用表示,已有数据的哈希码用表示;去除常数项,目标函数变为:
这个问题可以利用离散循环坐标下降法逐一比特求解,得到,并更新变量;
4)固定、、和求解:去除常数项,目标函数可写为:
则:
其中:
其中和为常数项,可以在更新函数前预先计算,存放到内存,因此更新只与新数据有关;
5)固定、、和求解:去除常数项,目标函数可写为:
则:
其中:
其中和为常数项,,可以在更新函数前预先计算,存放到内存,因此更新只与新数据有关;
6)固定、、和求解:去除常数项,目标函数可写为:
则:
其中:
其中和为常数项,可以在更新函数前预先计算,存放到内存,因此更新只与新数据有关;
7)固定、、和求解:与求解类似
其中:
其中和为常数项,可以在更新函数前预先计算,存放到内存,因此更新与新数据有关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鲁东大学,未经鲁东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810429547.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用水量异常检测方法和数据库服务器
- 下一篇:一种实时环境监测的网络存储设备