[发明专利]一种基于离线和在线聚类的车型数据库清洗方法在审
申请号: | 201810941282.3 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109189771A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 尚凌辉;张兆生;王弘玥;余天明 | 申请(专利权)人: | 浙江捷尚视觉科技股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06N20/00 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离线 车型 聚类 车型特征 清洗 车型数据 在线聚类 样本 数据库 初始聚类中心 随机初始化 长期运行 维持系统 整体性质 连接层 标注 判定 删除 入库 输出 学习 | ||
本发明公开了一种基于离线和在线聚类的车型数据库清洗方法。本发明首先标注各类车型样本得到离线车型库,利用深度学习进行训练,取训练反向第二个的全连接层输出作为车型特征。其次分别提取各个类内所有车型特征进行离线聚类,得到n个类中心及相应阈值。然后定期提取在线车型库各个类内所有车型特征进行聚类,初始聚类中心为离线聚类得到的n个类中心,添加一个随机初始化中心的类后进行有约束的聚类,得到n+1类。最后根据离线聚类得到的阈值,依次判定并清洗属于前n类的车型数据,清洗最后一类车型数据。本发明可以在保持在线车型库内各类整体性质不变的情况下,有效删除错误入库的样本,从而维持系统长期运行的性能及稳定性。
技术领域
本发明涉及一种基于离线和在线聚类的车型数据库清洗方法。
背景技术
随着机动车保有量急剧增加,违法犯罪车辆逐年上升趋势,例如:肇事逃逸,车辆假牌,车辆套牌,机动车超速等犯罪现象每每都在上演。而技术的发展,智能车型识别方法正成为一种成熟有效的手段,可广泛应用在卡口车辆检测、套牌车检测、车辆检索等方面。
在很多应用中,都需要建立一个在线的车型库。基于深度学习的车型识别技术能够达到98%以上的准确率,但在长期运行中,不断入库的错误样本仍会导致其累积到一个难以维持系统性能及稳定性的程度。在此基础上,需要提出一种基于离线和在线聚类的车型数据库清洗方法,对车型库进行定期清洗以保持系统性能及稳定性。
现有的各种数据库清洗方法多为通用数据清洗或针对某一特定领域的数据清洗,缺少针对车型数据库的清洗方法。如《一种数据清洗方法201710704678.1》、《一种简化的大数据清洗方式201711182073.7》等。
发明内容
本发明针对现有技术的不足,提供了一种基于离线和在线聚类的车型数据库清洗方法。该方法针对在线更新的车型库存在一定量错误入库数据的情况,采用离线和在线聚类,对车型库进行定期清洗以保持系统性能及稳定性。
本发明解决技术问题所采取的技术方案为:
一.标注各类车型样本得到离线车型库,利用深度学习进行训练,取训练反向第二个的全连接层输出作为车型特征。
二.分别提取各个类内所有车型特征进行离线聚类,得到n个类中心及相应阈值。
三.定期提取在线车型库各个类内所有车型特征进行聚类,初始聚类中心为离线聚类得到的n个类中心,添加一个随机初始化中心的类后进行有约束的聚类,得到n+1类。
四.根据离线聚类得到的阈值,依次判定并清洗属于前n类的车型数据,清洗最后一类车型数据。
本发明的有益效果:本发明可以对智能车型识别应用中所建立的在线车型数据库进行定期快速清洗,可以在保持在线车型库内各类整体性质不变的情况下,有效删除错误入库的样本,从而维持系统长期运行的性能及稳定性。
附图说明
图1为离线深度学习训练网络结构。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他的实施例,都属于本发明保护的范围。
本发明的离线部分包括车型特征训练和车型特征离线聚类,在线部分包括车型特征提取、车型特征在线聚类。
一.标注各类车型样本得到离线车型库,利用深度学习进行训练,取训练反向第二个的全连接层输出作为车型特征。
二.分别提取各个类内所有车型特征进行聚类,得到n个类中心及相应阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江捷尚视觉科技股份有限公司,未经浙江捷尚视觉科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810941282.3/2.html,转载请声明来源钻瓜专利网。