[发明专利]一种基于人工智能的声纹特征提取方法及装置在审
申请号: | 202110267332.6 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112786059A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 徐琼;程铖;谢根;汪贵旗;聂亚子 | 申请(专利权)人: | 合肥市清大创新研究院有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/18;G10L17/02 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 李佼佼 |
地址: | 230000 安徽省合肥市合肥高新技术开发*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 声纹 特征 提取 方法 装置 | ||
本发明公开了一种基于人工智能的声纹特征提取方法及装置。本发明包括如下步骤:采集语音数据和非语音数据,建立样本数据库;从样本数据库中取一音频文件,进行处理得到音频帧序列;对音频帧序列中每一帧进行傅里叶变化,得到该帧对应的频谱图信息;将时域信息和频域信息进行提取,得到时域特征和频域特征;将时域特征和频域特征进行特征聚合,得到聚合后的特征;对聚合后的特征进行向量嵌入,得到声纹特征向量;将声纹特征向量输入至卷积神经网络模型进行训练,得到声纹特征模型;获取待识别语音数据进行预处理;从预处理后的语音特征数据输入声纹特征模型得到语音特征向量。本发明提高了声纹特征提取的准确率和效率。
技术领域
本发明属于声纹特征提取技术领域,特别是涉及一种基于人工智能的声纹特征提取方法及装置。
背景技术
传统的对声信号特征提取的方法有LPCC(线性预测倒谱系数)和MFCC(梅尔倒谱系数)等。
LPCC是基于线性预测分析(LPC)的方法求取声音信号的特征参数,基本思想为,通过声音信号在某个时间点之前的P个样本预测此点的声音样本,并且可以由这P个样本的线性组合表示。由工程器械声音信号的LPCC特征图(1)可以看到,不同器械信号的分布各有特点,但仅从第一个系数来看,这几类器械的参数都有重合,没有表现出对特征信号很好的区分性。
MFCC是基于人耳对声音的感知模型特性提出的,人的听觉对声音的感知能力与其频率呈非线性关系,对不同频率声音的灵敏程度不同,总体上对低频有更好的分辨能力。从声音信号的MFCC特征分布图上可以看出不同器械特征分布整体上有所区别,由工程器械声音信号的MFCC特征分布图中可以看出,第一个系数的取值相互之间差别较大,但存在一定范围的参数重合。因此使用MFCC特征可以实现基本的描述,但是对特征的区分度不够理想。
现有的声纹识别技术大多应用于说话人识别,是一种从语音信号中提取说话人的声纹特征进行身份验证的生物识别技术,该项技术可以应用在刑事侦查、司法鉴定和电话识别等多个领域,因此,如何尽可能地提高声纹特征的提取精度一直是本领域技术人员不断探索的主要方向之一。
发明内容
本发明的目的在于提供一种基于人工智能的声纹特征提取方法及装置,通过对样本数据库中的音频文件进行处理得到音频序列,对音频序列的每一帧进行傅里叶变化处理,提取声纹特征向量,并将声纹特征向量输入至卷积神经网络模型进行训练,得到声纹特征模型,解决了现有的声纹特征提取不准确、效率低的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于人工智能的声纹特征提取方法,包括如下步骤:
步骤S1:采集语音数据和非语音数据,建立样本数据库;
步骤S2:从样本数据库中取一音频文件,进行处理得到音频帧序列;
步骤S3:对音频帧序列中每一帧进行傅里叶变化,得到该帧对应的频谱图信息;所述频谱图信息包括:时域信息和频域信息;
步骤S4:将时域信息和频域信息进行提取,得到时域特征和频域特征;
步骤S5:将时域特征和频域特征进行特征聚合,得到聚合后的特征;
步骤S6:对聚合后的特征进行向量嵌入,得到声纹特征向量;
步骤S7:将声纹特征向量输入至卷积神经网络模型进行训练,得到声纹特征模型;
步骤S8:获取待识别语音数据进行预处理;
步骤S9:从预处理后的语音特征数据输入声纹特征模型得到语音特征向量。
优选地,所述步骤S2中,音频帧序列获取步骤如下:
步骤S21:将音频文件按照固定采样频率转换成固定位数的音频数字信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥市清大创新研究院有限公司,未经合肥市清大创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110267332.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全自动立模支抽芯模设备及其工作方法
- 下一篇:显示面板及显示装置