[实用新型]一种家庭语音处理系统有效
| 申请号: | 201420423442.2 | 申请日: | 2014-07-29 |
| 公开(公告)号: | CN204390737U | 公开(公告)日: | 2015-06-10 |
| 发明(设计)人: | 钱勇;康怀茂;武兵;邢猛;王海坤;谢信珍 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G10L15/20 | 分类号: | G10L15/20 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉;李新华 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 家庭 语音 处理 系统 | ||
技术领域
本实用新型涉及一种在家庭环境下使用语音交互控制家用设备,特别是一种家庭语音处理系统。
背景技术
随着科技的发展,语音交互技术已经广泛应用于各行各业,极大的提升了人机交互的体验效果。在家庭应用场景下,各种电器设备的控制及操作对语音控制的需求十分迫切。当前已经有一些在家庭环境使用语音交互控制电器设备的案例,但是由于家庭环境下充斥着各类噪声,而且说话人位置不固定,类似这些不确定因素导致语音交互准确性大大降低,用户体验较差,语音交互在家庭环境下使用存在巨大的挑战。
实用新型内容
本实用新型技术解决问题:当前的语音交互设备在安静环境下使用准确率较高,在不同家庭应用场景下使用鲁棒性较差,用户体验效果不好,为了克服现有技术的不足,本实用新型提供一种家庭语音处理系统,在家庭应用环境下时,提高了语音交互准确性,提升了用户体验效果。
本实用新型采用如下技术解决方案来实现上述目的:一种家庭语音处理系统,如图1所示,包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。
所述多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作;
所述微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器通过通讯装置将控制信息传送给控制装置,由控制装置实现对相关设备的控制;
所述语音唤醒模块、声源定位模块、语音增强模块、语音识别模块在微处理器中运行;录音装置的输出接至声源定位模块的输出,声源定位模块的输出连接语音增强模块,语音增强模块的输出分别接至语音唤醒模块和语音识别模块;所述声源定位模块根据多麦克风装置采集的语音信息确定声源至系统的相对位置;所述语音增强模块基于声源定位模块确定的声源位置信息形成有效波束,对波束内有效语音信号进行增强,对波束外噪声进行抑制;所述语音唤醒词模型引擎预置在处理器中,多麦克风装置采集的语音信息与内置的模型引擎进行对比语音识别,并输出结果;所述语音识别模块为有限词集语音识别系统。
所述多麦克风装置为多麦克风阵列,多麦克风“一”字排开,各麦克风之间间距不限。
所述通讯装置包含有线和无线两种形式,有线方式包含IIC、UART、SPI形式,无线方式包含2.4G、蓝牙、Wi Fi形式。
与现有技术方案相比,本实用新型的有益效果是:本实用新型使用多麦克风阵列系统,相对于传统的单麦克风采音系统,能够采集更多空间内的语音信息,为声源定位、语音增强提供数据保障。声源定位技术能够准确判定人员的位置信息,结合语音增强技术能够有效提升语音信号信噪比,提升在家庭环境下语音交互的准确性,提升用户体验效果,进而实现语音交互在家庭应用环境下的普及。
附图说明
图1是本实用新型系统框图;
图2是本实用新型涉及语音唤醒模块示意图;
图3是本实用新型涉及声源定位模块示意图;
图4是本实用新型涉及语音增强模块示意图。
具体实施方式
如图1所示,本实用新型一种家庭语音处理系统包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。多麦克风装置麦克风数量大于等于2个,麦克风类型以硅麦克风为主,同时能够兼顾普通驻极体麦克风;录音装置采用高精度、多通道录音芯片,提供高质量录音;语音唤醒模块、声源定位模块、语音增强模块、语音识别模块运行在微处理器中,微处理器使用高性能DSP芯片。
如图2所示,语音唤醒模块实现过程如下:
(1)声学特征提取:通过语音增强模块获取处理后的语音信号,提取具有区分性的、基于人耳听觉特性的特征;
(2)唤醒词检测:将提取的声学特征在唤醒词检测网络上计算声学得分,如果声学得分最优路径包含检测唤醒词,则确认检出唤醒词,否则重新回到第一步重新进行声学特征提取;
(3)唤醒词确认:将步骤二计算的声学得分与预先设定的门限进行对比,如果声学得分大于门限值,则确认为真实唤醒词,输出给执行模块,如果声学得分小于门限值,则确认为虚假唤醒词,重新回到第一步重新进行声学特征提取。
如图3所示,声源定位模块实现过程如下:
(1)延时时间计算:根据麦克风阵列装置中各个麦克风录音音频计算延时时间T;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司;,未经科大讯飞股份有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201420423442.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光盘存放装置及具有这种装置的光盘存放袋
- 下一篇:一种适用于小空间的降噪装置





