[发明专利]模型训练方法、特征提取方法及装置有效
| 申请号: | 201911250580.9 | 申请日: | 2019-12-09 |
| 公开(公告)号: | CN113033582B | 公开(公告)日: | 2023-09-26 |
| 发明(设计)人: | 祝勇义 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06V10/764;G06V20/40;G06N3/0455;G06N3/047;G06N3/048;G06N3/088 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 杨春香 |
| 地址: | 310051 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 特征 提取 装置 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
从视频流中提取原始图片,并按照设定的图片遮挡方式对所述原始图片中设定的部分内容进行遮挡得到训练图片;所述训练图片由至少两个视频帧组成且每一视频帧中设定的部分内容被遮挡;
将所述训练图片输入至机器视觉学习模型,以由所述机器视觉学习模型中的编码器对输入的训练图片进行编码得到特征编码并输出给所述机器视觉学习模型中的解码器,以由所述解码器根据输入的特征编码重构出所述训练图片中被遮挡的内容;
获取所述训练图片中各视频帧之间的帧关系预测结果,所述帧关系预测结果是由所述机器视觉学习模型中与所述编码器连接的帧间关系预测器依据所述编码器得到的训练图片中每一视频帧的特征编码预测出的,所述帧关系预测结果用于指示所述训练图片中的各视频帧之间是否满足设定的帧关系条件;
根据所述设定的部分内容和所述解码器重构出的被遮挡的内容对所述机器视觉学习模型的模型参数进行调整得到第一目标模型,包括:根据所述帧关系预测结果、所述训练图片中各视频帧之间的帧关系、所述各视频帧中设定的部分内容和所述解码器重构出的各视频帧中被遮挡的内容,对所述机器视觉学习模型的模型参数进行调整得到第一目标模型,所述第一目标模型用于提取待识别图像的图像特征,所述第一目标模型还用于预测两个以上视频帧之间的帧关系。
2.根据权利要求1所述的方法,其特征在于,所述根据帧关系预测结果、所述训练图片中各视频帧之间的帧关系、所述各视频帧中设定的部分内容和所述解码器重构出的各视频帧中被遮挡的内容对所述机器视觉学习模型的模型参数进行调整得到第一目标模型,包括:
依据所述各视频帧中设定的部分内容和所述解码器重构出的各视频帧中被遮挡的内容确定第一损失函数;
依据所述帧关系预测结果和所述训练图片中各视频帧之间的帧关系确定第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述机器视觉学习模型的模型参数进行调整得到第一目标模型。
3.根据权利要求2所述的方法,其特征在于,所述根据第一损失函数和第二损失函数对所述机器视觉学习模型的模型参数进行调整得到第一目标模型包括:
将所述第一损失函数和所述第二损失函数进行设定运算得到第三损失函数;
利用所述第三损失函数对所述机器视觉学习模型的模型参数进行调整,并检查所述第三损失函数是否满足设定的训练停止条件;
如果是,确定调整后的机器视觉学习模型为所述第一目标模型,如果否,获取训练图片并返回将训练图片输入至所述机器视觉学习模型的步骤。
4.根据权利要求3所述的方法,其特征在于,所述设定的训练停止条件包括:
本次训练过程中确定出的损失函数的值与上一次训练过程中确定出的损失函数的值之间的差值不超过设定阈值。
5.根据权利要求1至3任一所述的方法,其特征在于,所述从视频流中提取原始图片,并按照设定的图片遮挡方式对所述原始图片中设定的部分内容进行遮挡得到训练图片,包括:
从所述视频流中提取至少两个视频帧,并按照设定的图片遮挡方式对提取的每一视频帧中设定的部分内容进行遮挡得到训练图片,其中,提取的至少两个视频帧满足设定的帧关系条件;和/或,
从所述视频流中提取至少两个视频帧,并按照设定的图片遮挡方式对提取的每一视频帧中设定的部分内容进行遮挡得到训练图片,其中,提取的至少两个视频帧不满足设定的帧关系条件。
6.一种特征提取方法,其特征在于,所述方法包括:
将待识别图像输入至按照如权利要求1至5任一方法训练出的第一目标模型,得到所述待识别图像的图像特征,所述待识别图像的图像特征用于训练机器视觉识别模型。
7.一种电子设备,其特征在于,所述设备包括可读存储介质和处理器;
其中,所述可读存储介质,用于存储机器可执行指令;
所述处理器,用于读取所述可读存储介质上的所述机器可执行指令,并执行所述指令以实现权利要求1-5或6任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911250580.9/1.html,转载请声明来源钻瓜专利网。





