[发明专利]对象识别统计方法及装置、电子设备、存储介质在审
| 申请号: | 202110568125.4 | 申请日: | 2021-05-25 |
| 公开(公告)号: | CN113033516A | 公开(公告)日: | 2021-06-25 |
| 发明(设计)人: | 杨飞;王梦 | 申请(专利权)人: | 中国科学院地理科学与资源研究所 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
| 地址: | 100000 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对象 识别 统计 方法 装置 电子设备 存储 介质 | ||
1.一种对象识别统计方法,其特征在于,所述方法包括:
爬取设定区域的街景图片,对所述街景图片中的待识别对象进行标注,生成标注数据,将所述标注数据作为预训练图像数据;
将所述预训练图像数据转换为统一格式;
将统一格式的所述预训练图像数据输入特征提取网络,将所述预训练图像数据转换为不同步长的第一特征图数据;
根据不同步长的第一特征图数据,计算所述第一特征图数据的特征图金字塔网络FPN的两层以上的第二特征图数据;
遍历所述两层以上的第二特征图数据,将每层第二特征图数据上的每个像素点对应到原图上而分别生成对应的锚框;
在所述锚框中,确定区域生成网络RPN训练时的正类样本和负类样本;
将每一层的所述锚框进行不同长宽比例的变换,并确定变换后的所述锚框作为前景或背景的概率,作为分类信息,以及,确定变换后的所述锚框的偏移量的回归,作为回归信息;在所述分类信息中,查找所述正类样本和所述负类样本所对应的概率值,并基于所述正类样本和所述负类样本的标签,计算交叉熵损失值;在所述回归信息中,查找所述正类样本所在索引对应的偏移量,计算所述正类样本的偏移量,以及所述正类样本与真实框之间的偏移量值,计算回归损失值;
在变换后的所述锚框中选取设定数量的锚框,作为感兴趣区域ROI,并对所述锚框数值进行非最大值抑制NMS计算,去除重复的锚框;
计算剩余的ROI中每个ROI与真实框之间的交并比IOU,根据IOU对剩余的ROI进行正样本与负样本分类;计算每个正样本ROI与最接近的真实框之间的偏移量,并将真实框所对应的类别信息赋予其对应的正样本,并保存每个正样本ROI最接近的真实框的掩码信息;
基于所述掩码信息确定并识别出所述待识别对象。
2.根据权利要求1所述的方法,其特征在于,所述爬取设定区域的街景图片,包括:
在电子地图的设定区域中确定起始街景图片采样点,所述采样点的标识为panoID;
从所述街景图片采样点开始,遍历首条道路中存放的panoID数组中的最后一个起始街景图片采样点时,解析道路数组中的非当前元素,并将所述非当前元素对应到关联Link数组中的panoID,得到下一条道路的首个街景图片采样点,作为下一条道路的锚节点sid;
搜索设定区域内的所有道路的sid;
为搜索到的每个sid分别建立相应文档,并在所述文档中写入与sid对应的道路中的所有街景图片采样点及其panoID;
根据panoID发送请求命令并获取响应,遍历每条panoID,拼接每个街景图片采样点的图片下载链接,进行街景图片的下载。
3.根据权利要求1所述的方法,其特征在于,所述对所述街景图片中的待识别对象进行标注,生成标注数据,包括:
选择并读取街景图片的文件中每个原始街景图片的源文件;
通过绘制多边形create polygon命令,对原始街景图片中的待识别对象的区域边框进行编辑,进行目标标注;
将标注后的原始街景图片保存为设定格式的文件,作为预训练图像数据。
4.根据权利要求1所述的方法,其特征在于,所述将所述预训练图像数据转换为不同步长的第一特征图数据,包括:
对所述预训练图像数据分别进行归一化和激活处理;
并对激活处理后的预训练图像数据进行批量标准化BN训练;
对BN训练后的预训练图像数据进行ReLU激活,得到不同步长的两层以上的第一特征图数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院地理科学与资源研究所,未经中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110568125.4/1.html,转载请声明来源钻瓜专利网。





