[发明专利]基于谱特征和ELM的语音情感识别方法有效
| 申请号: | 201911189489.0 | 申请日: | 2019-11-28 |
| 公开(公告)号: | CN110827857B | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 张健沛;史芝欣;杨静;王勇 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/18;G10L25/24;G10L25/27;G10L25/45;G10L15/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 elm 语音 情感 识别 方法 | ||
本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征;利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC,二者加权得到teCMFCC特征,并与基本特征值进行融合,构建特征矩阵;用Fisher准则和相关分析对特征进行选择降维,保留语音信号的个性特征;建立极限学习机ELM决策树模型,完成语音情感识别分类。本发明强调了语音信号的非线性特征,具有很好的鲁棒性,在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验,验证提出的基于谱特征和ELM的语音情感识别算法对中文语音信号具有很好的分类识别精度。
技术领域
本发明涉及的是一种语音情感识别方法,具体地说是一种基于倒谱特征(cepstral-based spectral feature)的语音情感识别方法。
背景技术
1997年,美国麻省理工学院的Picard教授提出了情感计算(AffectiveComputing)的概念。情感计算作为计算机科学、神经科学、心理学等多学科交叉的新兴研究领域,已然成为人工智能的重要发展方向之一,而为了以自然的方式理解和传达彼此的意图,人机交互(HCI)近年来也受到越来越多的关注,人们希望计算机能更加像人。语音作为一种快速且易于理解的通信方式,是人们日常生活中最常用、最有效、最方便的交流方式,人们通过声带发声,除了表达基本的语意信息以外,还表达了说话人的情感等信息,因此研究人员将语音视为一种人与机器之间交互的快速有效的方法,这便要求机器能够智能识别人类的声音。至今,人们对语音识别进行了大量研究,但大多做的是语音转变为文本的识别过程。人机交互面临的主要问题是如何让机器准确识别掌握情绪信息的能力,类似于人类的情商能力,即人类与机器最大的区别在于人类有大脑,可思考,有情感。
与拥有几十年研究历史的语音识别技术相比,语音情感识别技术在仍处于起步阶段。语音情感识别相关研究出现在20世纪80年代中期,1985年Minsky教授“让计算机具有情感能力”观点的提出,以及人工智能领域的研究者们对情感智能重要性认识的日益加深,越来越多的科研机构开始了语音情感识别研究的探索。在此期间,它得到了世界范围内相关研究者们的广泛关注,也取得了一些令人瞩目的成绩,但同时也面临着诸多问题的考验与挑战。目前,语音情感识别分类系统一般由数据采集、预处理、特征提取、特征降维和分类决策组成。其中特征提取和分类决策在语音情感识别中起到至关重要的作用。
特征提取的任务是从输入的语音信号中提取能够区分不同情感的参数序列。当前用于语音情感识别的特征大致可分为韵律学特征、基于谱的相关特征和音质特征这3种类型。韵律是指语音中凌驾于语义符号之上的音高、音长、快慢和轻重等方面的变化,它的情感区分能力已得到语音情感识别领域研究者们的广泛认可,使用非常普遍,其中最为常用的韵律特征有时长(duration)、基频(pitch)、能量(energy)等;声音质量特征是用于衡量语音清晰度、是否容易辨识的主观评价指标,用于衡量语音是否纯净、清晰、容易辨识等,用于衡量声音质量的声学特征一般有:共振峰频率及其带宽、频率微扰和振幅微扰、声门参数等;基于谱的相关特征被认为是声道形状变化和发声运动之间相关性的体现,语音中的情感内容对频谱能量在各个频谱区间的分布有着明显的影响,有越来越多的研究者们将谱相关特征运用到语音情感的识别中来,并起到了改善系统识别性能的作用。在语音情感识别任务中使用的线性谱特征一般有线性预测系数(Linear Predictor Coefficient,LPC),单侧自相关线性预测系数(One-sided Autocorrelation Linear Predictor Coefficient,OSALPC),对数频率功率系数(Log-frequency Power Coefficient,LFPC)等;倒谱特征一般有:MFCC,CFCC,线性预测倒谱系数(Linear Predictor Cepstral Coefficient,LPCC),Gammatone滤波倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911189489.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种梁棚一体化危岩落石防护棚洞
- 下一篇:手术无影灯





