[发明专利]嘈杂工况环境的机器人语音控制系统有效
申请号: | 201810104069.7 | 申请日: | 2018-02-02 |
公开(公告)号: | CN108447479B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 刘丽兰;孙干;高增桂;陈恩来;孙鹏飞 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/20;G10L21/0208;G10L21/0216 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 嘈杂 工况 环境 机器人 语音 控制系统 | ||
1.用于嘈杂工况环境的机器人语音控制系统,其特征在于:包括语音语义在线识别数据平台(1)、移动客户端(2)、本地语音控制装置(3)和工业协作机器人(4),语音语义在线识别数据平台(1)、移动客户端(2)和本地语音控制装置(3),三者通过无线网络相互连接,本地语音控制装置(3)和工业协作机器人(4)通过串口线连接;通过所述移动客户端(2)连接或组建无线网络,由于本地语音控制装置(3)中有集成的无线连接模块(14),所以本地语音控制装置(3)可联网;所述移动客户端(2)扫描连接本地语音控制装置(3),并请求语音语义在线识别数据平台(1)的服务,完成本地语音控制装置(3)和语音语义在线识别数据平台(1)的网络连接,由于本地语音控制装置(3)中有集成的语音数据核心模块(15),运行Android系统,可基于语音数据核心模块(15)的主服务,实现客户端服务,完成本地语音控制装置(3)和语音语义在线识别数据平台(1)的数据传输;所述本地语音控制装置(3)采集语音信号并进行降噪处理,将处理后的语音信号传输至语音语义在线识别数据平台(1),实现在线的语音语义识别,识别结果数据再返回给本地语音控制装置(3),本地语音控制装置(3)接收数据并进行处理,处理后的数据按照既定通信协议传输给工业协作机器人(4),工业协作机器人(4)获得数据后进行指令解析并执行相应的动作或姿态。
2.根据权利要求1所述的用于嘈杂工况环境的机器人语音控制系统,其特征在于:所述语音语义在线识别数据平台(1)是基于深度学习的大数据平台,可采用科大讯飞股份有限公司的语音开放平台,接入语音识别服务,具有语义VAD、特征识别、基于上下文识别、连续语音识别和上下文理解功能,能够对上传至数据平台的语音信号进行在线的语音语义识别,并将识别后的数据返回给本地语音控制装置(3)中集成的语音数据核心模块(15),基于深度神经网络技术的在线语音识别提高了语音控制系统对嘈杂工况环境中复杂噪声的鲁棒性。
3.根据权利要求1所述的用于嘈杂工况环境的机器人语音控制系统,其特征在于:所述本地语音控制装置(3)内置有装置电源(8)、集成电路板(9)和左右声道音响(6);所述装置电源(8)和左右声道音响(6)均通过飞线连接集成电路板(9),以保证三者在本地语音控制装置(3)内的安装合理;所述本地语音控制装置(3)在结构上包括上盖(7)和底座(5),二者通过螺栓连接,形成一个盒体,其中上盖(7)周边采用阵列孔的设计形式,开孔面尽可能大,孔数尽量密集,以保证内置集成电路板(9)所集成的麦克风阵列模块(13)的拾音效果,避免掩蔽效应,底座(5)设计有左右两个独立的密封腔体放置左右声道音响(6),用以避免外放合成语音影响内置集成电路板(9)所集成的麦克风阵列模块(13)的拾音效果。
4.根据权利要求3所述的用于嘈杂工况环境的机器人语音控制系统,其特征在于:所述集成电路板(9)包含麦克风阵列模块(13)、无线连接模块(14)、语音数据核心模块(15)、识别结果发送模块(16)以及USB电源接口(17)、RS485/232串口(18)、复位开关(20)、无线连接按钮(21)和电源开关(22);所述麦克风阵列模块(13)采集语音信号,将语音信号传输给语音数据核心模块(15),语音数据核心模块(15)对语音信号进行处理,通过无线连接模块(14)实现语音信号上传至语音语义在线识别数据平台(1),并接收返回的语音识别数据,将数据预处理后传输给识别结果发送模块(16),进行识别数据的进一步处理,然后经过RS485/232串口(18)向机器人发送数据信息;所述集成电路板(9)的麦克风阵列模块(13)采用圆形六麦麦克风阵列形式,利用空间分布的多路麦克风拾取声音信号,通过对麦克风阵列的各路输出信号进行分析和处理,得到一个或多个声源的位置信息,实现声源定位功能,同时利用麦克风阵列的空域滤波特性,通过对唤醒人的角度定位,形成定向拾音波束,并对波束以外的噪音进行抑制,提升远场拾音质量,保证识别效果,有效克服了工业场景下的噪声环境,因此采用的圆形六麦麦克风阵列模块具有拾音降噪、回声消除和声源定位功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810104069.7/1.html,转载请声明来源钻瓜专利网。