[发明专利]用户属性的识别方法、装置、电子设备及计算机可读介质在审
申请号: | 202111479318.9 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114203183A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 李婷;梁天健;陈以松;熊杰;肖锋;刘冬寅;邓莉 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/04;G10L25/24;G10L21/0208;G06K9/62 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 属性 识别 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种用户属性的识别方法,其特征在于,包括:
获取待识别的通话语音数据,并提取所述通话语音数据对应的特征向量;
将所述特征向量输入预先训练的外呼用户分类模型中,得到所述通话语音数据中的外呼用户的性别属性;
根据所述外呼用户的性别属性从预先训练的两个接听用户分类模型中确定出目标接听用户分类模型;
将所述特征向量输入所述目标接听用户分类模型中,得到所述通话语音数据中的接听用户的性别属性。
2.根据权利要求1所述的用户属性的识别方法,其特征在于,所述提取所述通话语音数据对应的特征向量,包括:
通过预先训练的语音基础模型对所述通话语音数据中的每个语音帧的属性进行标注,其中,所述语音帧的属性包括男音、女音和静音;
根据属性为静音的所述语音帧所在的位置,将所述通话语音数据划分为多个语音数据片段;
根据各个所述语音帧的属性确定各个所述语音数据片段中的男音帧数比或女音帧数比;
根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量;
根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量;
根据所述帧数比分布统计量和所述基音频率分布统计量,得到所述通话语音数据对应的特征向量。
3.根据权利要求2所述的用户属性的识别方法,其特征在于,所述根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量,包括:
根据各个所述语音数据片段中的男音帧数比得到所述通话语音数据的男音帧数比数组,或者根据各个所述语音数据片段中的女音帧数比得到所述通话语音数据的女音帧数比数组;
获取预设的多个帧数比区间范围,根据所述男音帧数比数组和所述帧数比区间范围得到男音帧数比分布统计量,或者根据所述女音帧数比数组和所述帧数比区间范围得到女音帧数比分布统计量;
将所述男音帧数比分布统计量或者所述女音帧数比分布统计量作为所述通话语音数据的帧数比分布统计量。
4.根据权利要求2所述的用户属性的识别方法,其特征在于,所述根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量,包括:
根据预设的有效基音频率区间去除所述通话语音数据中的噪音帧,得到所述通话语音数据中的有效语音帧;
根据各个所述有效语音帧的基音频率得到所述通话语音数据对应的基音频率数组;
获取预设的多个基音频率区间范围,并根据所述基音频率数组和所述基音频率区间范围得到所述通话语音数据对应的基音频率分布统计量。
5.根据权利要求2所述的用户属性的识别方法,其特征在于,所述语音基础模型的训练方法包括:
获取历史通话语音数据,并根据所述历史通话语音数据中语音帧的属性得到男音训练样本、女音训练样本和静音训练样本;
分别从所述男音训练样本、所述女音训练样本和所述静音训练样本中提取对应的语音特征,并通过所述语音特征训练得到男音基础模型、女音基础模型和静音基础模型。
6.根据权利要求1所述的用户属性的识别方法,其特征在于,所述外呼用户分类模型的训练方法包括:
获取所述外呼用户分类模型对应的第一语音训练数据,并获取各个所述第一语音训练数据对应的外呼属性;
确定各个所述第一语音训练数据对应的特征向量,并根据各个所述第一语音训练数据对应的特征向量得到外呼特征向量组;
根据所述第一语音训练数据对应的外呼属性、所述外呼特征向量组以及预设分类算法训练得到所述外呼用户分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111479318.9/1.html,转载请声明来源钻瓜专利网。