[发明专利]基于柔性可穿戴传感器的语音识别设备在审

申请号：	201910962682.7	申请日：	2019-10-11
公开（公告）号：	CN110738991A	公开（公告）日：	2020-01-31
发明（设计）人：	吴俊;段升顺;查欣婧	申请（专利权）人：	东南大学
主分类号：	G10L15/20	分类号：	G10L15/20;G10L15/24;G10L15/02;G10L15/08
代理公司：	32204 南京苏高专利商标事务所(普通合伙)	代理人：	柏尚春
地址：	211102 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音信号语音识别可穿戴传感器稳定性和鲁棒性语音获取模块语音识别设备电信号输出麦克风处理单元环境应用获取单元机械振动空气传播网络单元嘈杂环境传统的高噪音鲁棒性信噪比语音说话污染转化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于柔性可穿戴传感器的语音识别设备，包括语音获取单元，语音信号接受处理单元和语音识别网络单元，所述语音获取模块包括柔性可穿戴传感器，通过柔性可穿戴传感器将说话时的喉结振动这一机械振动转化为电信号输出，其中电信号的频率和幅度正相关于喉结振动的频率和幅度。与传统的麦克风获取语音信号相比，极大的降低了语音信号在空气传播时被污染的问题，提高了信号的信噪比，提高了高噪音环境下语音识别的鲁棒性和稳定性。本发明为解决嘈杂环境下高精度语音信号获取以及为提高语音识别多环境应用的稳定性和鲁棒性提供新的解决方案。

技术领域

本发明涉及语音识别技术、柔性电子和神经网络，具体涉及到一种基于柔性可穿戴传感器的语音识别设备。

背景技术

自从50年代的Bell实验室研发了第一个可实现十个英文数字的系统后，语音识别技术经历了长足的发展，而HMM模型和人工神经网络(ANN)的成功引用，使得语音识别系统的性能比以往更优异。我国的语音识别研究工作虽然起步较晚，但由于国家重视和中国庞大的市场效应，使得语音识别技术在国内也快速发展。

但是，传统的语音识别技术语音信号的获取依赖于麦克风，信源从说话者到麦克风需要经历空气信道的传输，而在此过程中，语音在空气等传播介质中传播时容易受到噪声的影响，严重影响麦克风接收器接收到的有效信息。由于此种语音识别系统对环境敏感，采集到的语音训练系统只适用于与之对应的环境，这也是影响其从实验室演示系统向商品的转化。

发明内容

本发明的目的是提供一种基于柔性可穿戴传感器的语音识别设备，以解决语音信号源的获取易受环境影响的缺点，增加语音识别系统的鲁棒性和多复杂环境的适用性。

技术方案：一种基于柔性可穿戴传感器的语音识别设备，包括：

语音获取单元，包括贴合在脖子部位的柔性可穿戴传感器和模数转换单元，可穿戴传感器获取说话时喉结振动信号，并将其转化为模拟电信号，模数转换单元接收该模拟电信号，将其编码为数字信号；

语音信号接收处理单元，与语音获取单元连接，对所述数字信号进行音频数据预处理后，提取语言信号的特征向量；

语音识别网络单元，与语音信号接收处理单元连接，对语音信号接收处理单元提取的特征向量进行解码，并利用字典、声学模型和语言模型构建搜索空间，在搜索空间内通过搜索算法寻找最优路径，得到语音识别结果。

所述音频数据预处理具体包容如下内容：

步骤1、语音信号接收处理单元获取数字信号，对语音信号进行滤波处理，之后利用端点检测技术对首尾端静音进行切除；

步骤2、对上步处理得到的音频信号采用移动窗函数进行分帧处理，得到一系列的帧；

步骤3、利用PLP,Mel倒谱系数等算法对每一帧进行处理，将每一帧转换为包含声音信息的特征向量。

所述语音识别的具体步骤如下：

步骤1、将语音信号接收处理单元处理得到的每一帧的特征向量输入到基于深度神经网络和隐马尔可夫的声学模型中，所述声学模型根据声音特性计算每个特征向量在声学特征上的得分，输出为该帧对应的音素(拼音)信息；