[实用新型]一种基于DSP的语音端点检测系统有效

专利信息
申请号: 201320097898.X 申请日: 2013-03-04
公开(公告)号: CN203288240U 公开(公告)日: 2013-11-13
发明(设计)人: 张梅 申请(专利权)人: 安徽理工大学
主分类号: G10L25/87 分类号: G10L25/87
代理公司: 安徽合肥华信知识产权代理有限公司 34112 代理人: 余成俊
地址: 232001 *** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 dsp 语音 端点 检测 系统
【说明书】:

技术领域

实用新型主要涉及语音信号的端点检测,尤其涉及一种基于DSP的语音端点检测系统。 

背景技术

语音识别技术以逐步走向应用,语音识别的稳定性和健壮性问题已经逐步成为语音识别研究的焦点。具有应用价值的语音识别系统必须可以适应各种各样的噪声环境。而目前的语音识别系统性能并不能满足要求,在噪声环境下性能会大大降低,其中一个主要的原因就是语音端点检测不够准确,因此,准确、可靠、稳健的语音端点检测算法在语音识别系统中是必不可少的。理想的端点检测算法应当具有以下几个特征:准确性、可靠性、鲁棒性、自适应性、实时性等。在这些特征中,最难做到的就是鲁棒性。因此,如何在噪声背景下设计一种鲁棒的端点检测算法是一个待解决的难题。 

传统的语音检测方法如基于能量和过零率方法都是比较经典的方法。这些在安静或噪声比较小的环境下,判别效果令人满意,但是当语音信号中的清浊音与噪声相当时,就很难从噪声中区分出语音。 

针对噪声干扰的情况,近来出现了不少将语音增强与语音端点检测结合的方法。这些方法改变了直接进行语音端点检测的方式,变为采用语音增强和语音端点检测两个步骤。其中语音增强是一种通过提升被加性噪声污染的语音来改善语音的清晰度与可懂度感觉的技术。带噪语音经过语音增强处理后,信号的信噪比得到了提升,凸显了语音的特征值,从而提高语音端点检测的成功率。根以上方法虽然在各自实验环境下都取得一定的改进效果,但在强噪声环境下的性能,以及实现过程中门限阈值的选取、避免脉冲于扰噪声的影响等问题,还有待进一步研究和验证。 

近些年,研究学者提出了各种可以区分语音和噪声的特征参数或其衍生参数,用以提高算法的抗噪性。如倒谱系数、自相关函数、短时频带方差、信息熵等都被应用与端点检测技术中,更常用的是将几种技术综合起来进行语音检测。 

另一方面,在实现语音端点检测的硬件上,多选用的TI公司DSP为核心芯片。在低端、低成本系列中,TI公司的TMS320C2000(C24x和C28x) DSP系列, 在汽车、大型设备、硬盘、调制解调器以及个人消费电子产品中广泛采用。在中端处理器系列中,主要有TI公司的TMS320C5000(C54x和C55x)DSP。这一等级的处理器通过时钟运行速率的提高以及更复杂的架构获得了更高的性能。它们在降低功耗的同时大大提升了性能,因此常应用于可移动设备,如手机、无线设备、数码照相机、音频视频播放器和数字助听器中。在高端处理器系列中,TI公司的TMS320C6000(C62x、C64x和C67x) DSP通过超长指令集(VLIW)等先进架构获得了更优异的性能。但是对程序空间以及功耗的要求却十分苛刻,因此这类处理器常应用于高端视频系统、雷达系统、以及通信基站,高码率实时视频编码系统中。综上所述,从成本和性能两种角度来看,中端处理器系列的设计目标都能达到在DSP平台上实现语音检测系统的设计要求。 

实用新型内容

本实用新型目的就是为了弥补已有技术的缺陷,提供一种基于DSP的语音端点检测系统,可以实现语音信号的端点检测,并可将检测的数据传送给PC机,具有检测正确率高、快速及时等优点。 

为了实现上述目的,本实用新型是通过以下技术方案实现的: 

1.一种基于DSP的语音端点检测系统,其特征在于:包括有核心处理单元TMS320VC5416 DSP、语音信号编解码模块TLV320AIC23芯片和PC机,所述的 TMS320VC5416 DSP 中应用汇编语言设计有基于模糊神经网络的语音端点检测算法,所述的TLV320AIC23芯片信号输出端接入 TMS320VC5416 DSP信号输入端,所述的核心处理单元TMS320VC5416 DSP 信号输出端通过一个TL16C550异步串口收发器及一个MAX232电平转换芯片与PC机通讯连接;所述的 TMS320VC5416 DSP的外围还扩展连接有电源电路、复位电路、时钟电路;系统通过TLV320AIC23芯片输入采集的语音信号,将其转化为数字信号后送入TMS320VC5416 DSP进行端点检测运算,接着TMS320VC5416 DSP处理好的数据通过异步串口收发器TL16C550和电平转换芯片MAX232与PC机进行串行通信;系统还外扩了一片SRAM存储器和一片FLASH存储器,SRAM存储器用来存储语音数据,FLASH存储器用来存储脱机运行程序。 

所述的DSP的型号为TMS320VC5416,是TI公司生产的一种低功耗高性能定点DSP,适用于语音处理、有线和无线通信、便携式信息系统等方面。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201320097898.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top