[发明专利]基于柔性可穿戴传感器的语音识别设备在审
申请号: | 201910962682.7 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110738991A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 吴俊;段升顺;查欣婧 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/24;G10L15/02;G10L15/08 |
代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 柏尚春 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 语音识别 可穿戴 传感器 稳定性和鲁棒性 语音获取模块 语音识别设备 电信号输出 麦克风 处理单元 环境应用 获取单元 机械振动 空气传播 网络单元 嘈杂环境 传统的 高噪音 鲁棒性 信噪比 语音 说话 污染 转化 | ||
本发明公开了一种基于柔性可穿戴传感器的语音识别设备,包括语音获取单元,语音信号接受处理单元和语音识别网络单元,所述语音获取模块包括柔性可穿戴传感器,通过柔性可穿戴传感器将说话时的喉结振动这一机械振动转化为电信号输出,其中电信号的频率和幅度正相关于喉结振动的频率和幅度。与传统的麦克风获取语音信号相比,极大的降低了语音信号在空气传播时被污染的问题,提高了信号的信噪比,提高了高噪音环境下语音识别的鲁棒性和稳定性。本发明为解决嘈杂环境下高精度语音信号获取以及为提高语音识别多环境应用的稳定性和鲁棒性提供新的解决方案。
技术领域
本发明涉及语音识别技术、柔性电子和神经网络,具体涉及到一种基于柔性可穿戴传感器的语音识别设备。
背景技术
自从50年代的Bell实验室研发了第一个可实现十个英文数字的系统后,语音识别技术经历了长足的发展,而HMM模型和人工神经网络(ANN)的成功引用,使得语音识别系统的性能比以往更优异。我国的语音识别研究工作虽然起步较晚,但由于国家重视和中国庞大的市场效应,使得语音识别技术在国内也快速发展。
但是,传统的语音识别技术语音信号的获取依赖于麦克风,信源从说话者到麦克风需要经历空气信道的传输,而在此过程中,语音在空气等传播介质中传播时容易受到噪声的影响,严重影响麦克风接收器接收到的有效信息。由于此种语音识别系统对环境敏感,采集到的语音训练系统只适用于与之对应的环境,这也是影响其从实验室演示系统向商品的转化。
发明内容
本发明的目的是提供一种基于柔性可穿戴传感器的语音识别设备,以解决语音信号源的获取易受环境影响的缺点,增加语音识别系统的鲁棒性和多复杂环境的适用性。
技术方案:一种基于柔性可穿戴传感器的语音识别设备,包括:
语音获取单元,包括贴合在脖子部位的柔性可穿戴传感器和模数转换单元,可穿戴传感器获取说话时喉结振动信号,并将其转化为模拟电信号,模数转换单元接收该模拟电信号,将其编码为数字信号;
语音信号接收处理单元,与语音获取单元连接,对所述数字信号进行音频数据预处理后,提取语言信号的特征向量;
语音识别网络单元,与语音信号接收处理单元连接,对语音信号接收处理单元提取的特征向量进行解码,并利用字典、声学模型和语言模型构建搜索空间,在搜索空间内通过搜索算法寻找最优路径,得到语音识别结果。
所述音频数据预处理具体包容如下内容:
步骤1、语音信号接收处理单元获取数字信号,对语音信号进行滤波处理,之后利用端点检测技术对首尾端静音进行切除;
步骤2、对上步处理得到的音频信号采用移动窗函数进行分帧处理,得到一系列的帧;
步骤3、利用PLP,Mel倒谱系数等算法对每一帧进行处理,将每一帧转换为包含声音信息的特征向量。
所述语音识别的具体步骤如下:
步骤1、将语音信号接收处理单元处理得到的每一帧的特征向量输入到基于深度神经网络和隐马尔可夫的声学模型中,所述声学模型根据声音特性计算每个特征向量在声学特征上的得分,输出为该帧对应的音素(拼音)信息;
步骤2、利用语言模型构造汉字网络空间,然后通过字典构造音素(拼音)网络空间;
步骤3、在音素网络空间中通过动态规划剪枝算法搜索一条最优路径,使得在该路径得到的语音累计概率最大,输出的语音即为相应的语音信号。
所述字典为汉字与音素的映射关系。进一步的,汉字音素集为全部的声母和韵母。
所述语言模型采用N-Gram模型,其通过对大量文本信息进行训练,得到单个字或者词相互关联的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910962682.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:识别语音的方法和装置
- 下一篇:语音信息的处理方法及装置、存储介质、电子装置