[发明专利]一种信息处理方法、装置和计算机存储介质有效
| 申请号: | 201711298332.2 | 申请日: | 2017-12-08 |
| 公开(公告)号: | CN109902699B | 公开(公告)日: | 2023-07-11 |
| 发明(设计)人: | 马占宇;李晓旭;朱芳仪;郭晓威;彭湃;袁坤 | 申请(专利权)人: | 北京邮电大学;深圳市腾讯计算机系统有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 徐升升;张颖玲 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 装置 计算机 存储 介质 | ||
本发明实施例公开了一种信息处理方法、装置和计算机存储介质,所述方法包括:获得第一图像信息,获取所述第一图像信息包括的第一图像数据和对应的第一标注词;提取所述第一图像数据的词袋特征和深度卷积网络特征,提取所述第一标注词的词袋特征;基于所述第一图像数据的词袋特征、深度卷积网络特征以及所述第一标注词的词袋特征建立图像标注模型。
技术领域
本发明涉及信息处理技术,具体涉及一种信息处理方法、装置和计算机存储介质。
背景技术
作为无监督神经主题模型,例如文档神经自回归分布估计器(DocNADE,DocumentNeural Autoregressive Distribution Estimator)模型,获得了较好的主题特征。DocNADE模型基于词袋模型,很难融合Places-CNN这种具有取值连续的全局特征的模型。因此,如何将Places-CNN特征引入到主题模型中,目前尚无有效解决方案。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种信息处理方法、装置和计算机存储介质。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种信息处理方法,所述方法包括:
获得第一图像信息,获取所述第一图像信息包括的第一图像数据和对应的第一标注词;
提取所述第一图像数据的词袋特征和深度卷积网络特征,提取所述第一标注词的词袋特征;
基于所述第一图像数据的词袋特征、深度卷积网络特征以及所述第一标注词的词袋特征建立图像标注模型。
上述方案中,所述方法还包括:以目标参数最大化为优化目标求解所述图像标注模型的模型参数;
基于所述模型参数获得优化图像标注模型。
上述方案中,所述方法还包括:获得第二图像数据,提取所述第二图像数据的词袋特征和深度卷积网络特征;
基于所述第二图像数据的词袋特征、深度卷积网络特征以及所述优化图像标注模型获得所述第二图像数据的第二标注词的相关信息。
上述方案中,所述图像标注模型以图像特征和标注词特征的联合概率作为输出结果,所述图像特征和标注词特征的联合概率满足:
其中,p(v,w)表示图像特征和标注词特征的联合概率;v表示图像特征,w表示标注词特征。
其中,p(vi=t|vCNN,v<i)使用前向网络结构,满足:
则
其中,g()表示sigmoid函数;
其中,p(wi|vCNN,v,w<k)使用前向网络结构,满足:
则
其中,V和T表示不同的关联矩阵;h是隐层的表示,b和c表示隐层的不同偏置。
上述方案中,所述方法还包括:获得样本图像数据;基于所述样本图像数据和预设学习算法训练获得深度卷积网络模型。
上述方案中,提取所述第一图像数据的深度卷积网络特征,包括:
基于所述第一图像数据和所述深度卷积网络模型获得所述第一图像数据的深度卷积网络特征。
上述方案中,所述提取所述第一图像数据的词袋特征,包括:对所述第一图像数据按照网格划分方式获得多个第一图像区块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;深圳市腾讯计算机系统有限公司,未经北京邮电大学;深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711298332.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息生成方法和装置
- 下一篇:一种基于哈希算法的大规模影像匹配方法





