[发明专利]用于识别对象的方法和设备在审
申请号: | 201910568744.6 | 申请日: | 2019-06-27 |
公开(公告)号: | CN112149461A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 杨晓云;L·迈克尔 | 申请(专利权)人: | 中科智云科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 200085 上海市虹口*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 对象 方法 设备 | ||
1.一种用于识别对象的方法,包括:
经由摄像装置,获取放置在第一表面上的对象的视频图像,所述第一表面在所述视频图像被获取期间被旋转预定角度;
基于所述视频图像中的多帧图像,生成经标注的多个训练样本,所述多帧图像分别对应所述第一表面的多个不同的旋转角度;以及
基于所述多个训练样本,训练识别模型,所述训练识别模型用于确定待识别图像中的待识别对象的对象类别和对象数目中的至少一项。
2.根据权利要求1所述的方法,还包括:
基于所确定的所述对象类别和所述对象数目,确定所述待识别对象的价格。
3.根据权利要求1所述的方法,其中生成经标注的多个训练样本包括:
基于所述多帧图像中的第一帧图像,标注所述对象在第一帧图像中的首帧位置信息和所述对象类别;
基于所述首帧位置信息,确定所述对象在所述多帧图像中的其他每一帧图像中的逐帧位置信息;以及
基于所述逐帧位置信息和所述对象类别,分割所述多帧图像,以生成用于形成所述训练样本的多个单体参考图像,所述训练样本与所述对象类别相关联。
4.根据权利要求3所述的方法,其中确定逐帧位置信息包括:
基于所述首帧位置信息、所述多帧图像中的相邻帧图像的像素在时间域上的变化以及所述相邻帧图像之间所述对象的运动信息,确定所述逐帧位置信息。
5.根据权利要求3所述的方法,其中确定逐帧位置信息包括:
调整所述多帧图像中的当前帧图像中的所述逐帧位置信息,使得所述当前帧图像中的所述对象位于标注框内,所述标注框与所述逐帧位置信息相关联。
6.根据权利要求1所述的方法,其中确定待识别对象的对象类别和对象数目中的至少一项包括:
将待识别图像转换为多维矩阵,以用于识别所述待识别对象的所述对象类别。
7.根据权利要求1所述的方法,其中确定待识别对象的对象类别和对象数目中的至少一项包括:
确定待识别图像中与所述待识别对象相关联的对象区域;以及
基于所述对象区域,确定所述对象类别和对象数目中的至少一项。
8.根据权利要求7所述的方法,其中确定所述待识别对象的对象类别和对象数目中的至少一项包括:
基于所述对象区域,生成关于所述对象类别的多个识别结果;
对所述多个识别结果进行排序;以及
基于经排序的识别结果与预定参考图像的相似度,确定所述对象类别,所述预定参考图像与预定对象类别相关联。
9.根据权利要求1所述的方法,其中识别模型为包括输入层、中间层和输出层的卷积神经网络,所述中间层包括多个卷积层。
10.根据权利要求1所述的方法,其中获取放置在第一表面上的对象的视频图像包括:
获取所述对象以第一位姿放置在所述第一表面上的第一视频图像包括;以及
获取所述对象以第二位姿放置在所述第一表面上的第二视频图像。
11.根据权利要求1所述的方法,其中获取放置在第一表面上的对象的视频图像包括:
经由多个摄像装置,分别获取所述对象放置在所述第一表面上的多个视频图像,所述多个摄像装置中的摄像头相对于所述对象处于不同的拍摄位置。
12.根据权利要求1所述的方法,其中所述多个摄像装置中的摄像头中的至少两个摄像头距离所述第一表面的垂直距离被设置为不同。
13.根据权利要求1所述的方法,还包括:
响应于检测到所述第一表面开始被旋转,使所述摄像装置获取放置在所述第一表面上的所述对象的视频图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科智云科技有限公司,未经中科智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910568744.6/1.html,转载请声明来源钻瓜专利网。