[发明专利]一种语音控制家庭智能终端的系统在审
申请号: | 201710027021.6 | 申请日: | 2017-01-15 |
公开(公告)号: | CN106875944A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 谢锋 | 申请(专利权)人: | 深圳市丰巨泰科电子有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L17/22;G10L15/06;G10L15/10;G10L17/06;H04L12/28 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 肖平安 |
地址: | 518000 广东省深圳市宝安区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 控制 家庭 智能 终端 系统 | ||
技术领域
本发明涉及智能家居,具体涉及一种语音控制家庭智能终端的系统。
背景技术
现在技术大部分是通过手机APP手动操作,选择产品联动,通过手机上的产品APP手动操作,体验交互不佳,步骤繁琐而不高效。
发明内容
本发明的目的是通过识别各自语音来进行家庭智能端物联网平台上的产品实现有效联动,给具体发送需求的人就行,精准操控,提高其操控体验,提供一种语音控制家庭智能终端的系统。
本发明采用的技术方案是:一种语音控制家庭智能终端的系统,包括语音数据单元、预处理单元、提取特征参数单元、VQ模型训练单元、VQ码本匹配计算单元、码本库单元、识别输出单元;所述语音数据单元输出数据到预处理单元;所述预处理单元输出数据到提取特征参数单元;
在训练阶段,对每一个说话者的语音信息通过语音数据单元和预处理单元提取语音数据特征参数,所提取的语音数据特征参数进行分类,通过VQ模型训练单元产生不同码字所组成的码本;在识别或匹配阶段,通过VQ码本匹配计算单元,根据码本库单元的信息,用VQ方法计算平均失真测度,判断说话的人;其中的矢量量化起着双重作用。
进一步地,所述语音控制家庭智能终端的系统通过语音实现家庭智能终端控制的方法包括以下步骤:
S1,在家庭智能物联网端通过语音设定自己个性化设备联动及智能场景;
S2,平台端根据语音识别或暗号来具体细分每一个使用者的设定及信息指令;
S3,使用者发送具体指令,平台端识别其语音;
S4,根据语音对比,确定具体发送信息者,来反馈具体信息给设备,执行其特定个性化场景。
更进一步地,所述步骤S1还包括特征参数的提取、用矢量量化聚类法生成码本及VQ的说话人识别。
更进一步地,所述的特征参数的提取具体为采用NFCC的方法来提取,具体提取过程如下:
S11,对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息:
设语音信号的DFT为:
其中式中x(n)为输入的语音信号,N表示傅立叶变换的点数;
S12,再求频谱幅度的平方,得到能量谱;
S13,将能量谱通过一组Mel尺度的三角形滤波器组:
定义一个有M个滤波器的滤波器组,采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,3,···,M本系统取M=100;
S14,计算每个滤波器组输出的对数能量:
0≤m≤M-1
其中mH(k)为三角滤波器的频率响应;
S15,经过离散弦变换DCT得到MFCC系数:
0≤n≤N-1
MFCC系数个数通常取20—30,本系统选取20阶倒谱系数。
更进一步地,所述的用矢量量化聚类法生成码是将每个待识的说话人看作是一个信源,用一个码本来表征;码本是从该说话人的训练序列中提取的MFCC特征矢量聚类而生成;只要训练的序列足够长,认为这个码本有效地包含了说话人的个人特征,而与讲话的内容无关;
本系统采用基于分裂的LBG的算法设计VQ码本,Xk(k=1,2,…,K)为训练序列,B为码本;具体实现过程如下:
S21,取提取出来的所有帧的特征矢量的型心作为第一个码字矢量B1;
S22,将当前的码本Bm根据以下规则分裂,形成2m个码字;
其中m从1变化到当前的码本的码字数,ε是分裂时的参数,此处取ε=0.01;
S23,根据得到的码本把所有的训练序列(特征矢量)进行分类,然后按照下面两个公式计算训练矢量量化失真量的总和D[n]以及相对失真(n为迭代次数,初始n=0,D[-1]=∞,B为当前的码书),若相对失真小于某一阈值ε,迭代结束,当前的码书就是设计好的2m个码字的码书,转到相对失真计算;否则,转下一步;
量化失真量和:
相对失真:
S24,重新计算各个区域的新型心,得到新的码书,转步骤S23;
S25,重复S22,S23和S24步骤,直到形成有M个码字的码书,其中D0=10000。
更进一步地,所述VQ的说话人识别具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市丰巨泰科电子有限公司,未经深圳市丰巨泰科电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710027021.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于大数据分析的语音识别系统
- 下一篇:语音控制方法、装置和空调器