[发明专利]图片识别模型的训练方法及设备在审
申请号: | 202010977452.0 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112132199A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 陈志远 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 识别 模型 训练 方法 设备 | ||
1.一种图片识别模型的训练方法,其中,该方法包括:
步骤S1,对整体数据集中的图片进行d维的特征提取,对提取出的特征进行聚类,以得到K个簇,其中,d、K为正整数;
步骤S2,计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度;
步骤S3,基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,为每个簇匹配一个包含d维特征中的多维特征的子空间,以使每个簇各自匹配后的子空间的适合程度之和最大,其中,各个子空间所包含的各维特征互不相同;
步骤S4,遍历对整体数据集中的每张图片,对每张图片确定所属的簇,获取每张图片所属的簇对应的子空间,基于损失函数对所述每张图片进行对应子空间的图片识别模型的一轮训练,重新执行步骤S1~S4,直到各子空间的图片识别模型收敛为止。
2.根据权利要求1所述的方法,其中,计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,包括:
对于K个簇中的某一个簇Ck对d维的特征中的其中一维特征fi的适合程度用如下公式进行计算:
其中,三元组(xa,xp,xn)~Ck是在簇Ck中采样出的,表示在d维的特征中的第i维特征中定义的余弦距离,xa、xp、xn分别表示的是整体数据集中的一张图片,整体数据集训练记为X={x1,…,xn},x1,…,xn为各张图片,xp表示的是和xa同一类别的图片,xn表示的是和xa不同类别的图片。
3.根据权利要求1所述的方法,其中,为每个簇匹配一个包含d维特征中的多维特征的子空间,包括:
基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,将d维特征均分到每个簇。
4.根据权利要求3所述的方法,其中,基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,将d维特征均分到每个簇,包括:
基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,用线性规划的方法将d维特征均分到每个簇。
5.一种图片识别模型的训练设备,其中,该设备包括:
第一装置,用于对整体数据集中的图片进行d维的特征提取,对提取出的特征进行聚类,以得到K个簇,其中,d、K为正整数;
第二装置,用于计算K个簇中的每个簇分别与d维特征中的每一维特征的适合程度;
第三装置,用于基于K个簇中的每个簇分别与d维特征中的每一维特征的适合程度,为每个簇匹配一个包含d维特征中的多维特征的子空间,以使每个簇各自匹配后的子空间的适合程度之和最大,其中,各个子空间所包含的各维特征互不相同;
第四装置,用于遍历对整体数据集中的每张图片,对每张图片确定所属的簇,获取每张图片所属的簇对应的子空间,基于损失函数对所述每张图片进行对应子空间的图片识别模型的一轮训练,重新执行步骤第一至第四装置,直到各子空间的图片识别模型收敛为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010977452.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种肉酱灌装机
- 下一篇:一种复合电极的体声波谐振器及其制备方法