[实用新型]一种基于FPGA的Mel倒谱分析合成仪有效
申请号: | 201220233638.6 | 申请日: | 2012-05-23 |
公开(公告)号: | CN202615783U | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 杨鸿武;丁朋程;裴东;王全州;甘振业;郭威彤 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G10L13/04 | 分类号: | G10L13/04 |
代理公司: | 甘肃省知识产权事务中心 62100 | 代理人: | 李琪 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fpga mel 谱分析 合成 | ||
技术领域
本实用新型属于语音合成和嵌入式应用技术领域,涉及一种利用可编程片上系统(System On a Programmable Chip, SOPC)技术实现语音合成的综合器,具体涉及一种基于FPGA的Mel倒谱分析合成仪。
背景技术
语音分析合成方法是语音研究的重要方法。语音合成的研究已有多年的历史,现在研究的语音合成方法从技术上讲可分为波形合成法、规则合成法和参数合成法。波形合成法一般有两种形式:一种是波形编码合成法,直接把要合成的语音的发音波形进行存储或进行编码压缩后存储,合成重放时再解码组合输出;另一种是波形编辑合成法,把波形编辑技术用于语音合成,选择不同的合成基元,容易达到很高的合成质量;但波形合成法过于依赖大语料库。规则合成法是一种高级的合成方法,通过语音学规则产生语音,可以合成无限词汇的语句,但其合成算法相当复杂。参数合成法也称分析合成法,为了节约存储容量,必须先对语音信号进行分析,提取出语音参数,以压缩存储量,然后由人工控制这些参数的合成。参数合成法具有实现算法简单和数据容量小的优势。
目前已有的语音分析合成方法包括:1)线性预测合成方法,大部分语音编码算法都采用线性预测分析方法,提取了线性预测系数或等价参数。但是线性预测系数只能表示语音的短时谱,不能用来刻画谱零点较多的语音。2)正弦模型分析合成方法。正弦模型方法在语音信号处理领域中得到了广泛的应用,该模型的谐波噪声系数可以直接用来参数合成,而且适用于大幅度地修改时长和基因周期。但估计参数较多,优化算法比较复杂,求解过程不够稳定。3)Mel倒谱分析合成方法,根据语音的短时幅度谱,利用人耳听觉的非线性特点,计算得到的Mel倒谱系数(Mel Cepstral Coefficients, MCC)不仅能够反映频谱的极点,还能反映零点,而且能够合成出高质量的语音。但是在语音的分析合成过程中需要进行大运算量的处理计算,而这种处理计算目前只在普通PC机上进行,没有实现便携化和仪器化。
实用新型内容
为了克服上述现有技术中存在的问题,本实用新型的目的是提供一种基于FPGA的Mel倒谱分析合成仪,不仅能进行大数据量的处理计算,实现语音的分析合成,而且实现了便携化和仪器化。
为实现上述目的,本实用新型所采用的技术方案是:一种基于FPGA的Mel倒谱分析合成仪,包括FPGA芯片,FPGA芯片分别与LCD显示器、codec音频芯片、SD卡存储器、FLASH存储器、SRAM存储器和SDRAM存储器相连接; FPGA芯片包括Avalon交换架构,Avalon交换架构分别与LCD显示驱动器、通用I/O端口、音频控制器、SPI总线控制器、三态桥、SRAM控制器、SDRAM控制器和NIOSⅡ处理器软核相连接;NIOSⅡ处理器软核嵌有JTAG调试模块,LCD显示驱动器与LCD显示器相连接;通用I/O端口和音频控制器分别与音频芯片相连接;SPI总线控制器与SD卡存储器相连接;三态桥与FLASH控制器相接,FLASH控制器与FLASH存储器相接;SRAM控制器与SRAM存储器相连;SDRAM控制器与SDRAM存储器相连。
NIOS II软核处理器通过AVALON总线分别与SRAM控制器、SDRAM控制器、FLASH控制器、SPI总线控制器和PIO控制器相连。
NIOS II软核处理器包括依次相连接的语音数据缓存器、分帧和加窗模块、短时傅里叶变换模块、对数运算模块、逆傅里叶变换模块和Mel倒谱系数运算模块;语音数据缓存器和Mel倒谱系数运算模块分别与SPI总线控制器相连接。
本实用新型Mel倒谱分析合成仪在FPGA中实现NIOS II嵌入式软核处理器例化。 NIOS II软核处理器将存储在SD卡中的语音信号读入到SDRAM芯片中,对数据进行缓存,再将数据从SDRAM中读出,对读出的数据分帧和加海明窗。然后在嵌入式NIOS II处理器中对音频信号做短时傅立叶变换、对数运算、IFFT(逆傅立叶变换),最后通过牛顿迭代法实现MCC的求解;利用MCC的值调节Mel倒谱逼近滤波器系数,使存储在SD卡中的语音激励源信号通过Mel对数谱逼近滤波器产生语音数据,通过音频芯片将数字音频信号转换成模拟语音信号输出。在进行大数据量的处理计算,实现语音分析合成的同时,实现了便携化和仪器化。
附图说明
图1是本实用新型Mel倒谱分析合成仪的结构示意图。
图2是本实用新型Mel倒谱分析仪中NIOSⅡ软核处理器的结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201220233638.6/2.html,转载请声明来源钻瓜专利网。