[发明专利]年龄识别方法及装置、存储介质在审
申请号: | 201910615118.8 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110321863A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 郭冠军 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G10L17/18;G06N3/04 |
代理公司: | 上海光栅知识产权代理有限公司 31340 | 代理人: | 马雯雯 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标用户 年龄识别 音频数据 人脸图像集合 存储介质 数据集合 图像数据 获取图像数据 间隔采样 年龄阶段 人脸识别 应用场景 预测模型 准确度 年龄段 维度 图像 | ||
1.一种年龄识别方法,其特征在于,包括:
获取图像数据与音频数据,所述图像数据与所述音频数据对应于同一个目标用户;
对所述图像数据进行人脸识别处理,得到所述目标用户的人脸图像集合;
对所述音频数据进行间隔采样处理,得到所述目标用户的人声数据集合;
利用年龄预测模型处理所述人脸图像集合与所述人声数据集合,得到所述目标用户的年龄识别结果;
其中,所述年龄识别结果包括如下至少一种:
所述目标用户的年龄;
所述目标用户所处的年龄阶段;
所述目标用户是否为目标年龄段用户。
2.根据权利要求1所述的方法,其特征在于,所述利用年龄预测模型处理所述人脸图像集合与所述人声数据集合,得到所述目标用户的年龄识别结果,包括:
利用训练好的第一年龄预测模型处理所述人脸图像集合,得到所述第一年龄预测模型输出的第一预测结果;
利用训练好的第二年龄预测模型处理所述人声数据集合,得到所述第二年龄预测模型输出的第二预测结果;
根据所述第一预测结果与所述第二预测结果,获取所述年龄识别结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一预测结果与所述第二预测结果,获取所述年龄识别结果,包括:
若所述第一预测结果与所述第二预测结果均指示所述目标用户为目标年龄段用户,确定所述年龄识别结果为:所述目标用户为所述目标年龄段用户;
或者,
若所述第一预测结果与所述第二预测结果中的至少一个指示所述目标用户为目标年龄段用户,确定所述年龄识别结果为:所述目标用户为所述目标年龄段用户;
或者,
若所述第一预测结果与所述第二预测结果用于预测所述目标用户的年龄,获取所述第一预测结果与所述第二预测结果之间的加权值或最小值,以作为所述年龄识别结果。
4.根据权利要求1所述的方法,其特征在于,所述利用年龄预测模型处理所述人脸图像集合与所述人声数据集合,得到所述目标用户的年龄识别结果,包括:
提取所述人脸图像集合中的人脸特征向量;
提取所述人声数据集合中的人声特征向量;
将所述人脸特征向量与所述人声特征向量进行融合,得到融合特征向量;
利用训练好的第三年龄预测模型处理所述融合特征向量,得到所述第三年龄预测模型输出的所述年龄识别结果。
5.根据权利要求1所述的方法,其特征在于,所述年龄识别方法执行于第四年龄识别模型中;
其中,所述第四年龄识别模型的输入为所述图像数据与所述音频数据,输出为所述目标用户的年龄识别结果。
6.根据权利要求5所述的方法,其特征在于,所述第四年龄识别模型包括:Wavenet神经网络模型。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述图像数据进行人脸识别处理,得到至少两个用户的人脸图像集合;
对所述音频数据进行间隔采样处理,得到至少两个用户的人声数据集合;
根据各用户的所述人脸图像集合与所述人声数据集合,分别获取各用户的年龄识别结果。
8.根据权利要求1所述的方法,其特征在于,所述图像数据与所述音频数据属于同一个视频数据。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据目标用户的年龄识别结果,判断所述目标用户是否为低龄用户;
若所述用户为所述低龄用户,对所述目标用户进行低龄保护处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910615118.8/1.html,转载请声明来源钻瓜专利网。