[发明专利]一种语音交互系统及方法在审
| 申请号: | 201710889487.7 | 申请日: | 2017-09-27 |
| 公开(公告)号: | CN107644643A | 公开(公告)日: | 2018-01-30 |
| 发明(设计)人: | 王冬 | 申请(专利权)人: | 安徽硕威智能科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L25/24;G10L15/18;G10L15/14 |
| 代理公司: | 昆明合众智信知识产权事务所53113 | 代理人: | 张玺 |
| 地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 交互 系统 方法 | ||
技术领域
本发明涉及语音交互领域,具体涉及一种语音交互系统及方法。
背景技术
随着人工智能走进日常生活中,人们对于语音交互的认识也越来越深,同时对人工智能中语音交互系统的要求也越来越高。现有专利CN107146622A 一种冰箱、语音交互系统、语音交互方法、计算机设备、计算机可读存储介质,其中,语音交互系统包括:语音采集模块,用于对语音信号采集和预处理,并将预处理后的语音信号发送至语音识别模块;语音识别模块,用于将预处理后的语音信号转化为文本信息,并将文本信息分别发送至处理模块和语义理解模块;语义理解模块,用于将文本信息转化为语义结果,并将语义结果发送至处理模块;处理模块,用于根据文本信息和语义结果,查询并结合相关联的信息库以执行语音信号对应的语音交互任务。
虽然现有专利CN107146622A实现了语言人机交互,提高了交互体验度。但是也存在如下弊端:当客户跟系统交互出现答非所问或者有明显的不能识别或者不理解客户的语音信息的时候,往往顾客无计可施,大大降低了人机交互的性能。
发明内容
本发明的目的在于提供一种语音交互系统及方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种语音交互系统,包括:
前处理模块,其包括声音预处理模块和端点检测模块,所述声音预处理模块分别与所述麦克风和端点检测模块电性连接;
声学模型库,其包括HMM模型匹配单元、TDNN模型匹配单元、HMM模型数据库和ANN模型数据库,所述HMM模型匹配单元与所述HMM模型数据库电性连接,所述TDNN模型匹配单元与所述ANN模型数据库电性连接;
语言模型库,其包括N-Gram模型数据库和Rule-based模型数据库;
识别模块,其包括MFCC参数特征提取单元和识别控制单元,所述MFCC 参数特征提取单元分别与所述识别控制单元和端点检测模块电性连接;所述识别控制单元分别与所述N-Gram模型数据库、Rule-based模型数据库、HMM 模型数据库、ANN模型数据库、语义理解模块和反馈模块电性连接;
交互中心,其包括语义理解模块、交互处理模块、应答信息库和语义词典数据库,所述交互处理模块分别与所述语义理解模块、反馈模块、应答信息库和语音合成模块电性连接,所述语音合成模块分别与反馈模块和扬声器电性连接。
优选的,所述声音预处理模块包括防混叠滤波器处理、A/D转换器转和分帧加窗处理。
优选的,所述端点检测模块为基于频带方差的端点检测模块。
优选的,所述识别控制单元为ARM单片机,且其上面集成了声音模型选择电路,用于选择HMM模型匹配单元和TDNN模型匹配单元,同时集成了语言模型库选择电路,用于选择N-Gram模型数据库和ANN模型数据库。
优选的,所述应答信息库内存储情景对话的应答映射。
优选的,所述语义词典数据库内存储语句语义映射。
优选的,所述反馈模块内设有存储器,用于存储所述交互处理模块传递过来的文本信息、语音合成模块传递过来到的语音信息和反馈指令。
一种语音交互方法,包括:
步骤一:带噪语音从麦克风传入所述语音交互系统,在所述声音预处理模块过程中经过防混叠滤波器滤波处理、A/D转换器信号转换和分帧加窗处理后再经过基于频带方差的端点检测模块后得到语音信号;
步骤二:步骤一中的语音信号经过所述MFCC参数特征提取单元后得到特征矢量,所述特征矢量传送到所述识别控制单元后,所述识别控制单元控制声音模型选择电路和语言模型库选择电路选择相应的模型匹配和语言模型库对特征矢量进行识别得到初始文本信息;
步骤三:步骤二中的初始文本信息经过所述语义词典数据库的映射和语义理解模块的处理得到识别文本信息;
步骤四:步骤三中的识别文本信息经过所述应答信息库的映射和交互处理模块的处理得到应答文本信息,同时所述交互处理模块将步骤二中的初始文本信息、步骤三种的识别文本信息和应答文本信息传递给所述反馈模块;
步骤五:步骤四中的应答文本信息经过所述语音合成模块处理后将应答文本信息转换成语音信息后经扬声器与客户交流;
步骤六:所述反馈模块存储步骤二中的初始文本信息、步骤三中的识别文本信息和步骤四中的应答文本信息,当重复出现相同的初始文本信息、识别文本信息或者初始文本信息、识别文本信息为反馈指令,则所述反馈模块向所述控制单元发出反馈信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽硕威智能科技有限公司,未经安徽硕威智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710889487.7/2.html,转载请声明来源钻瓜专利网。





