[发明专利]基于音视频感知的人物性别识别技术在审
| 申请号: | 202010923867.X | 申请日: | 2020-09-04 |
| 公开(公告)号: | CN114220036A | 公开(公告)日: | 2022-03-22 |
| 发明(设计)人: | 李东晋;彭德中;王骞;刘杰;张利君;银大伟;蒋瑞;付俊英 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/16;G06T3/40;G10L17/02;G10L17/04;G10L17/26;G10L25/24 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610065 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视频 感知 人物 性别 识别 技术 | ||
1.基于音视频感知的人物性别识别技术,其特征在于,包括以下步骤:
1)第一个特征分类器,基于音频特征对人物性别进行初步判定,得到初步判定结果;
2)第二个特征分类器,基于视频特征对人物性别进行初步判定,得到初步判定结果;
3)一个混合分类器,基于第一个特征分类器和第二个特征分类器的初步判定结果,对两者进行整合并输出最终的人物性别的判定结果,判定为男性或者女性。
2.根据权利要求1所述的基于音视频感知的人物性别识别技术,其特征在于,第一个特征分类器为基于音频特征的分类器,第二个分类器为基于视频特征的分类器。
3.根据权利要求2所述的基于音视频感知的人物性别识别技术,其特征在于,基于音频特征的分类器包括支持向量机(SVM)。
4.根据权利要求2所述的基于音视频感知的人物性别识别技术,其特征在于,第一个基于音频特征的分类器、第二个基于视频特征的分类器、和最终的混合分类器,其中每一个都包括支持向量机(SVM)。
5.基于音视频感知的人物性别识别技术,包含以下步骤:
1)生成一个数据库,里面包含多个待分类的男性和女性的面部图像;
2)从上述1)中数据库提取缩略图像;
3)训练支持向量机分类器以区分男性和女性的面部图像,包括确定合适的多项式核和拉格朗日乘子的上界;
4)生成一个数据库,里面包含多个待分类的男性和女性的语音;
5)从4)中数据库提取倒谱特征;
6)训练支持向量机分类器以区分男性和女性的语音,包括确定合适的径向基函数和拉格朗日乘子的上界;
7)使用语义融合的方式,结合基于音频特征和基于视频特征的分类结果,最终得到相比单独基于语音或者视频特征的更优的性别分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010923867.X/1.html,转载请声明来源钻瓜专利网。





