[发明专利]基于网络结构搜索的视觉问答方法有效
申请号: | 202110464526.5 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113282721B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 俞扬;詹德川;周志华;乔康;管聪;秦熔均;袁雷;张云天;胡毅奇 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/338;G06N3/045 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种基于网络结构搜索的视觉问答方法,包括如下步骤:采用第一人工神经网络模型对原始图片进行特征提取;采用第二人工神经网络模型对文本信息进行特征提取;待搜索的网络结构框架为编码‑解码器框架,定义三种搜索算子供框架网络搜索,所述搜索算子的输入为基于所述原始图片或/和所述文本信息所提取的图像特征或文本特征;使用基于梯度交替优化策略搜索网络结构的架构权重和算子的操作权重;使搜索网络按照多分类的方法输出候选词向量,并选择概率最大的词向量作为答案输出。本申请的有益之处在于提供了一种能在更大的空间搜索出更好的效果的基于网络结构搜索的视觉问答方法。 | ||
搜索关键词: | 基于 网络 结构 搜索 视觉 问答 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110464526.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种柔性钙钛矿叠层式波长上转换传感器
- 下一篇:一种叉车智能监测装置