[发明专利]具备多语义层级注意能力的遥感影像文本描述生成方法在审
| 申请号: | 202110136504.6 | 申请日: | 2021-02-01 |
| 公开(公告)号: | CN112948604A | 公开(公告)日: | 2021-06-11 |
| 发明(设计)人: | 袁媛;王丞泽 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06F16/50 | 分类号: | G06F16/50;G06N3/04;G06N3/08;G06K9/32 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 具备 语义 层级 注意 能力 遥感 影像 文本 描述 生成 方法 | ||
1.一种具备多语义层级注意能力的遥感影像文本描述生成方法,其特征在于,包括以下步骤:
步骤1:采用包含特征提取器、候选区域提出模块和候选区域池化模块的双阶段物体检测网络,在遥感描述任务数据集上完成对双阶段物体检测网络的训练;
将遥感描述任务数据集中遥感图像的所有描述文本标注内容提取建立编码词库;
步骤2:将待处理遥感图像输入完成训练的双阶段物体检测网络中,使用特征提取器输出全图对应的初级特征图,再将初级特征图直接输入双阶段物体检测网络的全连接层中获得1个全图特征向量;
步骤3:使用候选区域提出模块在初级特征图上进行候选区域提出,选择前k个分数最高的候选区域作为关键地物候选框;并在每个关键地物候选框的基础上取同中心放大两倍边长的区域作为关键地物邻域框;
步骤4:使用候选区域池化模块对所有的关键地物选框和关键地物邻域选框进行候选区域池化,池化后得到的特征输入双阶段物体检测网络的全连接层输出2k个特征向量;2k个特征向量和1个全图特征向量共同组成向量组,即多层视觉元素网格系统;
步骤5:将向量组输入跨层注意力分析模块,跨层注意力分析模块对向量组打分,调节向量组中不同特征向量在估计词汇时的权重;
步骤6:将调节权重后的向量组输入作为解码器的长短期记忆网络,长短期记忆网络在编码词库中选择用于描述待处理遥感图像的词汇进行输出;
步骤7:循环步骤5和步骤6,直至长短期记忆网络输出语句结束符号;按顺序组合长短期记忆网络输出的词语,即为待处理遥感图像的文本描述内容。
2.根据权利要求1所述的一种具备多语义层级注意能力的遥感影像文本描述生成方法,其特征在于,所述双阶段物体检测网络为Faster-RCNN。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110136504.6/1.html,转载请声明来源钻瓜专利网。





