[发明专利]基于深度强化学习网络构建对区域敏感的模型的方法在审
| 申请号: | 202111614735.X | 申请日: | 2021-12-28 |
| 公开(公告)号: | CN114004370A | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 黄凯奇;尹奇跃;张俊格;徐沛 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20;G06K9/62;G06V10/764;G06V10/82 |
| 代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 李永叶 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本公开涉及一种基于深度强化学习网络构建对区域敏感的模型的方法,该方法包括:获取初始化状态下的智能体对图像仿真环境进行搜索的搜索数据;根据搜索数据,生成注意力图,并对注意力图进行离散化处理;将搜索数据中的位置状态信息和离散化处理后的注意力图输入至初始化的虚拟奖励模型中,输出得到虚拟奖励信息;根据虚拟奖励信息来更新搜索数据中的奖励信息,并对应更新智能体的搜索策略模型和更新虚拟奖励模型;根据更新后的搜索数据和虚拟奖励模型,对更新后的搜索策略模型继续进行训练,直至达到训练结束条件,训练完成的搜索策略模型为能够区分相似图像的图像搜索模型。该方法能够对相似图像针对性地采取不同的搜索策略。 | ||
| 搜索关键词: | 基于 深度 强化 学习 网络 构建 区域 敏感 模型 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111614735.X/,转载请声明来源钻瓜专利网。





