[发明专利]一种基于人工智能的手机拍照识别垃圾分类方法有效
申请号: | 201911094136.2 | 申请日: | 2019-11-11 |
公开(公告)号: | CN110852263B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 杨菲;任永亮;贺同路;李嘉懿;郭学栋 | 申请(专利权)人: | 北京智能工场科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京君莫知识产权代理事务所(普通合伙) 11715 | 代理人: | 王凝 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 手机 拍照 识别 垃圾 分类 方法 | ||
1.一种基于人工智能的手机拍照识别垃圾分类方法,其特征在于:
S201:开始;
S202:判断用户是否已经选择过垃圾分类标准;
S203:若用户之前已选择过垃圾分类标准,则读取用户之前选择的分类标准;
S204:若用户之前未选择过垃圾分类标准,则让用户选择标准;
S205:采集图像信息;
S206:识别图像中每个垃圾物体;
S207:将识别的结果标注在原图像上,并显示在手机屏幕上;
识别结果为每个垃圾物体的边框以及对应的垃圾分类;
S208:判断用户选择是否保存图片;
S209:若用户选择保存图片,则将标注好的图片保存在手机本地,并将原图像和标注数据保存在服务器端;
S210:若用户选择不保存图片,则结束;
其中,识别图像中每个垃圾物体进一步包括:
S501:使用预训练的卷积网络提取图片的特征图;
S502:使用候选区域网络从特征图中得到每个物体的位置候选框;
S503:使用池化层将每个候选框内的特征图缩放成固定的尺寸;
S504:将上一步经过缩放后的候选框内的特征图输入到分类用的卷积神经网络中,获得候选框内物体的分类结果;
其中,卷积分类网络使用双线性卷积网络;使用两层由输入输出维度相等的3*3卷积层和2*2的最大值池化层共同构成的卷积层进行特征提取;将上一步输出的特征图复制为两份,将其中一份的第二个通道和第三个通道进行转置;将原特征图与转置后的特征图进行矩阵乘积,并将乘积结果压缩为一个维度的向量;对该向量进行求平方根和L2正则化操作;最后将处理后的向量并行输入到两个全连接层,其中一个全连接层用于输出预测的垃圾类别,另一个用于输出图片中垃圾图像的位置;通过这种方式,用户可在屏幕上获取拍摄的照片中每个垃圾物体的位置及其类别;
S505:结束。
2.根据权利要求1所述的基于人工智能的手机拍照识别垃圾分类方法,其特征在于,
采集图像的方式可以是用户进行拍照或录像,或是用户选择本地的照片。
3.根据权利要求2所述的基于人工智能的手机拍照识别垃圾分类方法,其特征在于,
分类标准可以是城市名称,也可以是具体分类标准名称或代码。
4.根据权利要求3所述的基于人工智能的手机拍照识别垃圾分类方法,其特征在于,
S206步骤中的识别图像中的垃圾在手机移动端进行识别。
5.根据权利要求4所述的基于人工智能的手机拍照识别垃圾分类方法,其特征在于,
S206步骤中的识别图像中的垃圾是使用手机将图像数据发送到服务器端,由服务器进行处理。
6.根据权利要求4所述的基于人工智能的手机拍照识别垃圾分类方法,其中手机端处理识别的过程进一步包括:
S301:开始;
S302:判断手机端本地是否存在网络模型文件;
S303:若手机端不存在网络模型文件,则从服务器上下载用户选择的垃圾分类标注对应的网络模型到本地;
S304:在手机端使用网络模型对图片中的垃圾进行识别;
S305:结束。
7.根据权利要求5所述的基于人工智能的手机拍照识别垃圾分类方法,其中服务器端处理识别的过程进一步包括:
S401:开始;
S402:将图像信息从手机端传送到服务器上;
S403:在服务器上使用网络模型对图片中的垃圾进行识别;
S404:将识别的结果信息从服务器传送到手机端;
S405:结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智能工场科技有限公司,未经北京智能工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911094136.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:船用仪表现场自动测试系统总线
- 下一篇:用于接合结构部件的搭接组件