[发明专利]图像处理方法和装置在审
申请号: | 201811149818.4 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109389640A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 胡耀全 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06T7/70 | 分类号: | G06T7/70 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 关键点 候选框 重合度 方法和装置 图像处理 图像 标注 图像检测 图像输入 训练过程 标注框 锚点 预设 分辨 集合 筛选 申请 | ||
本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括:获取已标注对象的姿态的图像;基于该图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将该图像输入卷积神经网络,基于该卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对该图像检测到的一个姿态。本实施例通过重合度对各个候选姿态进行筛选并取得关键点的平均值,以准确地分辨出图像中的各个姿态。
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及图像处理方法和装置。
背景技术
在确认人体关键点时,有时需要确认单人的关键点,有时则需要确认多个人中每个人的关键点。在相关技术中,检测多个人中每个人的关键点时,通常难以准确地检测出结果。
发明内容
本申请实施例提出了图像处理方法和装置。
第一方面,本申请实施例提供了一种图像处理方法,包括:获取已标注对象的姿态的图像,其中,图像包含至少两个对象,不同对象的姿态不同,姿态通过多个关键点指示;基于图像和对姿态的标注,对卷积神经网络进行训练,得到训练后的卷积神经网络,训练过程包括:将图像输入卷积神经网络,基于卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态;确定各个候选姿态所在的候选框与已标注的姿态的标注框的重合度,将重合度大于预设重合度阈值的候选框作为目标候选框;对于每个标注框所对应的目标候选框内的每一个关键点,取各个目标候选框内的该关键点的位置平均值;将各个关键点的位置平均值的集合作为对图像检测到的一个姿态。
在一些实施例中,在将图像输入卷积神经网络,基于卷积神经网络的在先设置的锚点姿态,确定各个对象的候选姿态之前,方法还包括:对目标图像中的多个预设姿态进行聚类,得到关键点集合;将各个关键点集合确定为锚点姿态,其中,不同关键点集合所包括的关键点在目标图像中的位置不同。
在一些实施例中,对目标图像中的多个预设姿态进行聚类,得到关键点集合,包括:对各个预设姿态所对应的多维向量进行聚类,其中,预设姿态所对应的多维向量的维度数量与预设姿态的关键点数量相同;将聚类中心的多维向量所对应的姿态的各个关键点组成关键点集合。
在一些实施例中,对于每个标注框所对应的目标候选框的每一个关键点,取各个目标候选框内候选姿态中的该关键点的位置平均值,包括:对于每个标注框所对应的每个目标候选框内的每一个关键点,响应于确定该关键点的位置在该标注框以外,将预设的第一预设权重作为该目标候选框内的该关键点的权重;响应于确定该关键点的位置在该标注框以内,将预设的第二预设权重作为该目标候选框内的该关键点的权重,第一预设权重小于第二预设权重;基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。
在一些实施例中,对于每个标注框所对应的目标候选框的每一个关键点,取各个目标候选框内候选姿态中的该关键点的位置平均值,包括:对于每个标注框所对应的每个目标候选框内的每一个关键点,确定该关键点与已标注的姿态中该关键点的距离是否小于或等于预设距离阈值;响应于确定小于或者等于,基于该标注框所对应的各个目标候选框内的该关键点的权重,确定各个目标候选框内的该关键点的位置平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811149818.4/2.html,转载请声明来源钻瓜专利网。