[发明专利]基于柔性可穿戴传感器的语音识别设备在审
申请号: | 201910962682.7 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110738991A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 吴俊;段升顺;查欣婧 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/24;G10L15/02;G10L15/08 |
代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 柏尚春 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 语音识别 可穿戴 传感器 稳定性和鲁棒性 语音获取模块 语音识别设备 电信号输出 麦克风 处理单元 环境应用 获取单元 机械振动 空气传播 网络单元 嘈杂环境 传统的 高噪音 鲁棒性 信噪比 语音 说话 污染 转化 | ||
1.一种基于柔性可穿戴传感器的语音识别设备,其特征在于,包括:
语音获取单元,包括贴合在脖子部位的柔性可穿戴传感器和模数转换单元,可穿戴传感器获取说话时喉结振动信号,并将其转化为模拟电信号,模数转换单元接收该模拟电信号,将其编码为数字信号;
语音信号接收处理单元,与语音获取单元连接,对所述数字信号进行音频数据预处理后,提取语言信号的特征向量;
语音识别网络单元,与语音信号接收处理单元连接,对语音信号接收处理单元提取的特征向量进行解码,并利用字典、声学模型和语言模型构建搜索空间,在搜索空间内通过搜索算法寻找最优路径,得到语音识别结果。
2.根据权利要求1所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述音频数据预处理具体包容如下内容:
步骤1、语音信号接收处理单元获取数字信号,对语音信号进行滤波处理,之后利用端点检测技术对首尾端静音进行切除;
步骤2、对处理得到的音频信号采用移动窗函数进行分帧处理,得到一系列的帧;
步骤3、利用PLP,Mel倒谱系数等算法对每一帧进行处理,将每一帧转换为包含声音信息的特征向量。
3.根据权利要求1所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述语音识别的具体步骤如下:
步骤1、将语音信号接收处理单元处理得到的每一帧的特征向量输入到基于深度神经网络和隐马尔可夫的声学模型中,所述声学模型根据声音特性计算每个特征向量在声学特征上的得分,输出为该帧对应的音素信息;
步骤2、利用语言模型构造汉字网络空间,然后通过字典构造音素网络空间;
步骤3、在音素网络空间中通过动态规划剪枝算法搜索一条最优路径,使得在该路径得到的语音累计概率最大,输出的语音即为相应的语音信号。
4.根据权利要求3所述的基于柔性可穿戴传感器的语音识别设备,其特征在于:所述字典为汉字与音素的映射关系。
5.根据权利要求4所述的基于柔性可穿戴传感器的语音识别设备,其特征在于:汉字中音素集为全部的声母和韵母。
6.根据权利要求3所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述语言模型采用N-Gram模型,其通过对文本信息进行训练,得到单个字或者词相互关联的概率。
7.根据权利要求1所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述语音获取单元包括蓝牙模块,语音获取单元和语音信号接收处理单元采用蓝牙无线传输模式;所述模数转换单元集成于蓝牙模块。
8.根据权利要求7所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述蓝牙模块包括滤波单元。
9.根据权利要求1所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述语音获取单元包括滤波单元,所述模拟电信号经滤波单元处理后编码为数字信号。
10.根据权利要求1所述的基于柔性可穿戴传感器的语音识别设备,其特征在于,所述语音获取单元包括供电模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910962682.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:识别语音的方法和装置
- 下一篇:语音信息的处理方法及装置、存储介质、电子装置