[发明专利]一种基于人工智能的声纹特征提取方法及装置在审

专利信息
申请号: 202110267332.6 申请日: 2021-03-11
公开(公告)号: CN112786059A 公开(公告)日: 2021-05-11
发明(设计)人: 徐琼;程铖;谢根;汪贵旗;聂亚子 申请(专利权)人: 合肥市清大创新研究院有限公司
主分类号: G10L17/04 分类号: G10L17/04;G10L17/18;G10L17/02
代理公司: 上海精晟知识产权代理有限公司 31253 代理人: 李佼佼
地址: 230000 安徽省合肥市合肥高新技术开发*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工智能 声纹 特征 提取 方法 装置
【权利要求书】:

1.一种基于人工智能的声纹特征提取方法,其特征在于,包括如下步骤:

步骤S1:采集语音数据和非语音数据,建立样本数据库;

步骤S2:从样本数据库中取一音频文件,进行处理得到音频帧序列;

步骤S3:对音频帧序列中每一帧进行傅里叶变化,得到该帧对应的频谱图信息;所述频谱图信息包括:时域信息和频域信息;

步骤S4:将时域信息和频域信息进行提取,得到时域特征和频域特征;

步骤S5:将时域特征和频域特征进行特征聚合,得到聚合后的特征;

步骤S6:对聚合后的特征进行向量嵌入,得到声纹特征向量;

步骤S7:将声纹特征向量输入至卷积神经网络模型进行训练,得到声纹特征模型;

步骤S8:获取待识别语音数据进行预处理;

步骤S9:从预处理后的语音特征数据输入声纹特征模型得到语音特征向量。

2.根据权利要求1所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S2中,音频帧序列获取步骤如下:

步骤S21:将音频文件按照固定采样频率转换成固定位数的音频数字信号;

步骤S22:在固定的时间窗内,对音频数字信号依次进行归一化、预加重、分帧加窗处理,得到音频帧序列。

3.根据权利要求2所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S22中:

所述归一化处理,用于减少不同样本之间的差异,且使得音频信号的幅值范围投影到[-1,1]之间;

所述预加重,用于提高音频信号的高频成分,使得音频信号从低频到高频变得相对平坦;采用高通滤波器提升高频分量,滤波器的响应特征如

H(z)=1-uz-1

其中,系数u的取值范围为[0.9,1],u为预加重系数;

所述分帧加窗处理声音信号采样归一化后的数据x(n)进行分帧加窗处理,采用一定长度的窗函数w(n)乘以声音信号x(n)得到每帧加窗后的信号xi(n),常用的窗函数有汉明窗、汉宁窗和矩形窗;其公式为:

xi(n)=w(n)*x(n)

所述汉明窗:

所述汉宁窗:

所述矩形窗:

4.根据权利要求1所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S3中,对音频帧序列中每一帧进行傅里叶变化的得到每帧音频序列的频谱,并对每帧音频序列的频谱取模的平方得到音频洗了的功率谱;通过预设滤波器对音频序列的功率谱滤波,得到音频序列的对数能量;对音频序列的对数能量进行离散余弦变化,得到音频的特征向量。

5.根据权利要求1所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S4中,时域信息和频域信息输入到二维卷积神经网络中,能够得到声音数据的时域特征和频域特征。

6.根据权利要求1所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S5中,时域特征和频域特征进行特征聚合包括:将所述时域特征和频域特征输入到局部向量聚合层,以使得局部向量聚合层对时域信息或频域信息相似度大于预设相似度的时域特征和频域特征聚合在一起。

7.根据权利要求1所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S6中,对聚合后的特征输入到全连接层,得到声纹特征向量。

8.根据权利要求1所述的一种基于人工智能的声纹特征提取方法,其特征在于,所述步骤S7中,声纹特征向量输入至卷积神经网络模型进行训练,得到用于识别声纹的声纹模型包括:

通过卷积神经网络模型的卷积层提取声纹特征向量的局部声纹信息;

通过卷积神经网络模型的全连接层将提取到的局部声纹信息进行连接,得到多维度的局部声纹信息;

通过卷积神经网络模型的池化层对多维度的局部声纹信息进行降维处理,得到声纹特征模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥市清大创新研究院有限公司,未经合肥市清大创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110267332.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top