[发明专利]智能家居协同麦克风语音控制的系统及其控制方法有效

专利信息
申请号: 201510740405.3 申请日: 2015-11-03
公开(公告)号: CN105427861B 公开(公告)日: 2019-02-15
发明(设计)人: 胡旻波 申请(专利权)人: 胡旻波
主分类号: G10L15/22 分类号: G10L15/22;G10L15/34;G05B13/04
代理公司: 无锡华源专利商标事务所(普通合伙) 32228 代理人: 聂启新
地址: 214000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了智能家居协同麦克风语音控制系统及控制方法,所述控制系统包括信号采集模块、控制中枢模块和云服务器;所述控制中枢模块包括语音监听模块、数据融合模块和降混响预处理模块。所述控制方法为:所述信号采集模块采集语音信号;所述控制中枢模块对语音信号进行降噪处理;所述云服务器识别语音信号,解析语音指令。本发明经过对语音信号的监听,之后又进行了数据融合和降混响预处理两次处理,有效抑制了环境噪音和房间反射,最大程度上保证了语音不失真,可确保后续语音识别的准确性。
搜索关键词: 智能家居 协同 麦克风 语音 控制系统 控制 方法
【主权项】:
1.一种智能家居协同麦克风语音控制系统,其特征在于:包括信号采集模块、控制中枢模块和云服务器;所述信号采集模块采集语音信号;所述控制中枢模块对语音信号进行降噪处理;所述云服务器识别并解析语音信号;所述控制中枢模块包括语音监听模块、数据融合模块和降混响预处理模块;所述语音监听模块包括:接收线程:对第i个麦克风,1≤i≤M∑,采集其实时录音信号yi(t),直至实时录音信号样本点的录音文件写满一个内存缓冲区,即采集到512个时域信号样本点;所述实时录音信号yi(t)为:yi(t)=si(t)+ni(t);ni(t)为实时噪音信号,si(t)为语音信号;如果用户未发出语音信号,则si(t)为0;平滑模块:将本缓冲区与前个缓冲区中的512个实时录音信号样本点一起,共同采用长度为1024汉宁窗进行平滑处理;FFT变换模块:对经过平滑模块平滑处理之后的数据进行快速傅里叶变换,将原时域信号变换为频域信号;方差计算模块:由FFT变换模块所得到的频域信号Yi(k)中,语音信号组成语音谱,噪音信号组成噪音谱;计算语音谱的方差λS,i(k)及噪音谱的方差λN,i(k);信噪比计算模块:根据方差计算模块的输出结果,计算先验信噪比ξk,i和后验信噪比γk,i,分别为:指示函数计算模块:根据信噪比计算模块的输出结果,计算指示函数Λk,i:判别函数计算模块:根据指示函数计算模块的输出结果,计算判别函数Pi:如果判别函数Pi大于阈值η=0.95,则说明监测到语音,否则说明没有监测到语音;如果任意一个麦克风监测到语音,则说明有用户在说话,启动所有麦克风录音发送线程,向数据融合模块发射语音信号,并向服务器发送处理信号;所述数据融合模块包括:STFT变换模块:对各路不同麦克风阵列的通道进行短时傅里叶变换,每一帧长512样本点,帧移256,平滑窗为汉宁窗;将原有的时域信号谱转换为时频谱Ym,i(t,k);t和k分别为时间帧和频带坐标;第一向量构建模块:对每一个阵列系统构建向量ym(t,k):T为转置操作符;省略时间帧和频带坐标之后,ym(t,k)简记为ym;由STFT变换的线性性质,有:ym=sm+nm;对所有阵列构建一个新向量y(t,k):y(t,k)=[y1(t,k)T,y2(t,k)T,…,yM(t,k)T]T;同样省略时间帧和频带坐标,有:y=s+n;自相关矩阵构建模块:根据向量构建模块得到的与时频谱相关的向量,根据前10帧,对每一个频带,估计噪音谱的自相关矩阵Rn,n(t,k):Rn,n(t,k)=λRn,n(t‑1,k)+(1‑λ)n(t,k)n(t,k)H;H代表厄尔米特转置,平滑因子λ=0.995;对每一个频带,每一时间帧,估计混合谱的自相关矩阵Ry,y(t,k):Ry,y(t,k)=λRy,y(t‑1,k)+(1‑λ)y(t,k)y(t,k)H;平滑因子λ=0.995;计算语音谱的自相关矩阵Rs,s(t,k):Rs,s(t,k)=Ry,y(t,k)‑Rn,n(t,k);目标函数优化模块:对每一个麦克风阵列系统,省略时间帧和频带坐标,构建优化目标函数Jm(Wm):E为期望算符;最优滤波器构造模块:根据目标函数优化模块得到的结果,最小化上述目标函数,即argminWmJm(Wm),得到最优滤波器其中是一个复数域矩阵,Γm为对角矩阵:语音信号融合模块:根据最优滤波器构造模块所构造的最优滤波器,计算融合后的语音信号原阵列系统共有Ωm路语音数据,经过融合之后,转化成1路数据;噪音得到抑制;所述降混响预处理模块包括线性预测系数估计总模块;所述降混响预处理模块以语音融合的输出为输入,即输入D为:通过在每一个频带线性预测的方式抑制掉房间反射,每一个频带的线性预测系数g(k)为:gm(k)=[gm(k,0),gm(k,1),…,gm(k,Lg‑1)]T线性预测阶数Lg=13;所述线性预测系数估计总模块包括:第二向量构造模块:构造向量dm(k):N为时间帧的数量;复数矩阵构造模块:根据dm(k)构造延迟τ帧的复数矩阵整合全部子系统数据成复数矩阵Dτ(k):Dτ(k)=[Dτ,1(k),Dτ,1(k),…,Dτ,M(k)];隐变量初始化模块:初始化隐变量线性预测系数估计模块:估计线性预测系数Λ为对角矩阵算子;混响后语音估计模块:估计降混响后的语音信号隐变量优化模块:最小化如下优化函数,迭代估计隐变量:log为自然对数算子,得到隐变量估计所述隐变量优化模块的输出信号返回线性预测系数估计模块,迭代五次之后,混响后语音估计模块输出最后的语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡旻波,未经胡旻波许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510740405.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top