[发明专利]一种基于深度学习图像语义分割的人数估计方法有效

申请号：	201710947732.5	申请日：	2017-10-12
公开（公告）号：	CN107679502B	公开（公告）日：	2019-10-08
发明（设计）人：	林坚	申请（专利权）人：	南京行者易智能交通科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	210014 江苏省南京市秦淮区永智路6***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	网络模型掩码训练样本集人数估计图像分块图像区域位置预测学习图像语义分割构建图片中点图像语义标签图检测图片分割统计
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习图像语义分割的人数估计方法，其特征在于包括以下步骤：

步骤1，构建训练样本集：采集待检测区域的视频图像，对每一张样本图片，标注出图像中的人头部位置，生成对应的掩码图片作为其标签，掩码图片中每个光圈点对应一个人头，原图及对应的标签掩码图作为训练样本集，所述原图为待检测区域的视频图像；

步骤2，选择或构建基于图像语义分割的深度网络模型；

步骤3，将样本集送入步骤2中确定的深度网络模型进行训练，得到适用于该训练样本集场景的模型，称为人头位置预测网络模型；

步骤4，输入与训练样本图片长宽相同的待检测图片至步骤3中训练得到的人头位置预测网络模型，得到预测的掩码图片，根据掩码图片中光圈点的位置和光圈点的个数可得到待检测图片中的人数以及每个人的位置信息。

2.如权利要求1所述的一种基于深度学习图像语义分割的人数估计方法，其特征在于，所述步骤1包括如下步骤：

将所述原图缩放至合适长宽；

在该处理后原图上标注出人头部位置，并将每个人头部的坐标信息写入到一个文本文件中；

生成一张与处理后原图长宽相同的像素值全为0的二值掩码图片，从上述步骤中生成的文本文件中读取人头部位置并映射到该掩码图片上，而后采用高斯模糊方法让每个位置形成像素值为1的小光圈点，处理后的掩码图片即为原图片的标签。

3.如权利要求2所述的一种基于深度学习图像语义分割的人数估计方法，其特征在于，所述步骤1中还包括一个步骤：

在所述采集场景图片，缩放图片至合适长宽步骤后,滤除图片中的无关区域。

4.如权利要求1所述的一种基于深度学习图像语义分割的人数估计方法，其特征在于，所述步骤2中采用的图像语义分割的深度网络模型为SegNet模型。

5.如权利要求1所述的一种基于深度学习图像语义分割的人数估计方法，其特征在于，所述步骤2中采用的图像语义分割的深度网络模型为基于原始SegNet模型的改进模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京行者易智能交通科技有限公司，未经南京行者易智能交通科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710947732.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载