[实用新型]音频交互系统有效
申请号: | 201720897711.2 | 申请日: | 2017-07-24 |
公开(公告)号: | CN207302639U | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 吴祖忠;方小伟;章学红;蔡雪阳;章鹏 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G11C11/00 | 分类号: | G11C11/00;G10L15/26;G10L19/00 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 交互 系统 | ||
技术领域
本实用新型实施例涉及语音识别领域,尤其涉及音频交互系统。
背景技术
音频交互系统中的一个重要部分是进行语音识别,语音识别的硬件处理电路从早期的多带通滤波器及线性匹配电路,到由微控制器组成的语音识别专用芯片,再到由数字信号处理器组成的语音识别系统,发展到了目前的由前端声学处理电路+运行神经网络的云端服务器方案架构。
目前主流的语音识别方案通过麦克风阵列和回声消除参考信号作为输入,进行降噪等处理后,通过WiFi连接到云端进行语音和语义识别。
上述主流的语音识别方案在网络状况异常时无法正常工作,从而影响音频交互系统的正常工作,进而降低用户体验。
实用新型内容
本实用新型提供音频交互系统,解决了网络状况异常时不能有效进行人机音频交互的问题。
第一方面,本实用新型实施例提供了音频交互系统,包括:音频采集模块、模数转换模块、WiFi模块和音频输出模块,还包括:现场可编程门阵列(Field Programmable Gate Array,FPGA)主板、信息存储模块;
所述信息存储模块,与所述FPGA主板相连,用于存储所述FPGA主板工作所需的文件信息;
所述FPGA主板,分别与所述模数转换模块及所述WiFi模块相连,用于对所述模数转换模块传输的原始音频数据进行音频处理形成目标音频数据;还用于基于获得的相关文件信息在确定所述WiFi模块的网络状况异常时离线识别所述目标音频数据,形成音频识别文本,并获得所述音频识别文本的音频应答文本;
所述音频输出模块,与所述FPGA主板相连,用于播放所述FPGA主板基于所述音频应答文本合成的应答语音信号。
本实用新型提供了音频交互系统,通过信息存储装置存储FPGA主板工作所需的文件信息;所述FPGA主板对模数转换模块传输的原始音频数据进行音频处理形成目标音频数据,然后基于获得的相关文件信息在确定所述WiFi模块的网络状况异常时离线识别所述目标音频数据,形成音频识别文本,并获得所述音频识别文本的音频应答文本;音频输出模块播放所述FPGA主板基于所述音频应答文本合成的应答语音信号。利用上述技术方案,解决了网络状况异常时不能有效进行人机音频交互的问题,实现在网络状况异常时,能够有效的进行人机音频交互,从而提高用户体验。
附图说明
图1是本实用新型实施例一中的音频交互系统结构示意图。
具体实施方式
下面结合附图和实施例对本实用新型作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本实用新型,而非对本实用新型的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本实用新型相关的部分而非全部结构。
实施例一
图1为本实用新型实施例一提供的音频交互系统结构示意图,本实施例可适用于人机音频交互的情况,该系统可以应用于银行、电信运营商、政府机构的服务型机器人、服务终端设备等。如图1所示,所述音频交互系统包括:音频采集模块110、模数转换模块120、WiFi模块130和音频输出模块140,还包括:现场可编程门阵列FPGA主板150和信息存储模块160,其中:
信息存储模块160,与FPGA主板150相连,用于存储FPGA主板150工作所需的文件信息。
FPGA主板150,分别与模数转换模块120及WiFi模块130相连,用于对模数转换模块120传输的原始音频数据进行音频处理形成目标音频数据;还用于基于获得的相关文件信息在确定WiFi模块130的网络状况异常时离线识别所述目标音频数据,形成音频识别文本,并获得所述音频识别文本的音频应答文本。
音频输出模块140,与FPGA主板150相连,用于播放FPGA主板150基于所述音频应答文本合成的应答语音信号。
在本实施例中,该音频交互系统的工作原理是通过信息存储模块160存储 FPGA主板150工作所需的文件信息;FPGA主板150对模数转换模块120传输的原始音频数据进行音频处理形成目标音频数据,然后基于获得的相关文件信息在确定WiFi模块130的网络状况异常时离线识别所述目标音频数据,形成音频识别文本,并获得所述音频识别文本的音频应答文本;音频输出模块140播放FPGA主板150基于所述音频应答文本合成的应答语音信号。其中,WiFi模块130可以为8223A-SR。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201720897711.2/2.html,转载请声明来源钻瓜专利网。