[发明专利]一种基于改进MFCC算法的嵌入式语音识别系统及方法在审
| 申请号: | 201811603216.1 | 申请日: | 2018-12-26 |
| 公开(公告)号: | CN109448700A | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 任彬;赵增旭;佟宽章;胡佳辉 | 申请(专利权)人: | 石家庄铁道大学 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/06;G10L15/02;G10L15/20;G10L25/24 |
| 代理公司: | 北京远创理想知识产权代理事务所(普通合伙) 11513 | 代理人: | 张素妍 |
| 地址: | 050043 河北省石家庄*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音信号 语音识别系统 特征模板 训练模式 主控系统 嵌入式 算法 匹配 预处理 混合特征参数 用户输入语音 用户语音信号 端点检测 蓝牙模块 数据覆盖 特征参数 特征匹配 特征提取 无线控制 用户指定 语音识别 预先存储 起始点 改进 存储 采集 | ||
本发明涉及一种基于改进MFCC算法的嵌入式语音识别系统及方法,其包括:进入识别模式,采集用户语音信号并进行预处理;对语音信号进行端点检测,确定语音信号的起始点和结束点;对语音信号进行特征提取得到12维的混合特征参数,即为用户输入语音信号的全部特征;将得到的特征参数与主控系统内预先存储的特征模板进行匹配,若匹配,则得到最终的识别结果;反之,则重新进行识别模式;通过蓝牙模块无线控制用户指定的设备;选择进入训练模式;用户选择训练模板的存放点,若各个模板存放点都已存有模板,则需要用户选择其中一个存放点进行数据覆盖;进入训练模式,并得到训练模板,存入到主控系统的特征模板存储区内,用于语音识别的特征匹配。
技术领域
本发明涉及一种嵌入式语音识别系统及方法,特别是关于一种基于改进MFCC算法的嵌入式语音识别系统及方法。
背景技术
通过语音识别,用户不必按下按键或做其他的复杂操作,而仅需发出语音指令,即可控制机械设备的运行,此外移动端设备通过语音识别,能够快速地将语音信号转化成文字。语音识别技术提高了人类地生产生活效率,于此同时,语音识别是人工智能的重要研究方向,具有广阔的发展前进。
目前,许多国家都将语音识别作为重点研究项目,许多公司也推出了语音识别产品。现有语音识别系统存在以下问题:1、语音识别系统需要借助强大的运算平台做支撑,用户须将语音信号传入云端,在线获得识别结果,这样的方式加大了语音识别的成本,并不适用于自动控制,移动设备等对成本要求较高的领域。2、语音识别平台在移动端上具有运用广泛且识别率较高的优点,但其并不能识别小语种或地方语言,具有一定的局限性。
发明内容
针对上述问题,本发明的目的是提供一种基于改进MFCC算法的嵌入式语音识别系统及方法,其能够实现多种设备的语音控制,并克服现有技术中无法识别小语种或地方语言的问题。
为实现上述目的,本发明采取以下技术方案:一种基于改进MFCC算法的嵌入式语音识别方法,其包括以下步骤:1)启动语音识别系统,显示菜单界面,并判断语音识别系统是否是第一次使用,若是,则进入步骤9),反之则进入步骤2);2)通过语音识别系统上的菜单键选择进入识别模式;3)语音识别系统中的主控系统通过采样电路开始采集用户语音信号;4)主控系统对采集到的语音信号进行预处理;5)预处理完成后,主控系统对语音信号进行端点检测,确定语音信号的起始点和结束点;6)端点检测完成后,主控系统对语音信号进行特征提取,得到12维的混合特征参数,该12维的混合特征参数即为用户输入语音信号的全部特征;7)对语音信号的特征提取完成后,主控系统将得到的特征参数与主控系统内预先存储的特征模板进行匹配,若匹配,则得到最终的识别结果;反之,则重新进行识别模式;8)由语音识别系统中的LCD显示屏显示识别结果,并通过语音识别系统的蓝牙模块无线控制用户指定的设备;9)通过菜单键选择进入训练模式;10)用户通过菜单键选择训练模板的存放点,若各个模板存放点都已存有模板,则需要用户选择其中一个存放点进行数据覆盖;11)选择完训练模板的存放点后,正式进入训练模式,并得到训练模板,存入到主控系统的特征模板存储区内,用于语音识别的特征匹配。
进一步,所述步骤5)中,主控系统对语音信号进行端点检测的方法包括以下步骤:5.1)主控系统提取识别前200ms的语音信号作为背景噪声,依据噪声信息和语音信息的短时平均幅度值的差异,根据单位时间跨过正负阈值的次数设置相应门限;5.2)设定当语音信号超过正负阈值之一或者同时超过正负阈值时,并超过预先设定的时间,则将此作为语音的起始点;设定语音信号同时低于正负阈值,并超过预先设定时间,则将此作为语音的结束点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811603216.1/2.html,转载请声明来源钻瓜专利网。





