[发明专利]语音通话的智能质检方法及系统在审
申请号: | 201911402499.8 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111128241A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 魏云波;张朋;周琦 | 申请(专利权)人: | 上海浩琨信息科技有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/00;G10L15/02;G10L15/04;G10L15/06;G10L15/26;G10L15/30;G10L25/60;G10L25/72;G10L25/78;H04L29/08 |
代理公司: | 上海坤元知识产权代理有限公司 31376 | 代理人: | 董强 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 通话 智能 质检 方法 系统 | ||
1.一种语音通话的智能质检方法,其用于对语音媒体信息流中的语音信息进行识别、分析和反馈,其特征在于,通过如下步骤实现,
步骤一.建立互联网端向手机端进行通信联系的通道;
步骤二.通过通讯服务器实现语音媒体信息流的传输;
步骤三.对语音媒体信息流进行语音数据处理;
步骤四.对语音媒体信息流进行情感检测分析;
步骤五.对语音媒体信息流进行语义分析;
步骤六.对步骤四或者步骤五所获取的分析结论进行质量检测;
步骤七.对步骤六中所获取的检测信息进行执行反馈。
2.根据权利要求1所述的一种语音通话的智能质检方法,其特征在于,所述的步骤二中,通过通讯服务器实现语音媒体信息流的传输并使用电话软交换平台捕获经由通道传输的媒体声音流并将媒体声音导出。
3.根据权利要求1或者2所述的一种语音通话的智能质检方法,其特征在于,所述的步骤三当中通过如下步骤实现对语音媒体信息流进行语音数据处理:
步骤3.1预处理:通过预加重、分帧、加窗对步骤二所获取的语音媒体信息流进行预处理;
步骤3.2语种识别:将分帧加窗后的信号转换为语谱图,使用深度卷积神经网络针对语谱图数据进行特征提取,并识别出相应语种;
步骤3.3提取声学特征:对分帧加窗后的各帧信号进行快速傅里叶FFT变换得到相应的频谱信号,并对语音信号的频谱幅度谱取模平方得到语音信号的能量谱,能量谱通过一组梅尔滤波器组,计算每个滤波器的对数输出能量,带入离散余弦变换得到MFCC系数,提取动态差分参数,得到N维MFCC参数;
步骤3.4根据语种提取对应语音的声学特征:根据不同语种特点,提取其他声学特征,并根据不同语种实际使用情况选用声学特征或对声学特征进行混合处理;
步骤3.5静音检测:通过预训练的基于深度神经网络DNN和长短时记忆单元LSTM的混合网络结构进行静音检测;
步骤3.6断句:根据静音检测结果及该语种对应预设阈值将语音流进行断句处理;
步骤3.7语音转文字:通过声学模型、语言模型其中一种或者其结合将语音转为对应语种文本信息输出。
4.根据权利要求1或者2所述的一种语音通话的智能质检方法,其特征在于,所述的步骤四通过以下步骤实现情感检测分析:将步骤3.3至步骤3.6所处理完毕的语音特征矩阵输入已训练的情感状态概率检测模型,得到对应的情感状态序列,确定对应的情感状态。
5.根据权利要求1或者2所述的一种语音通话的智能质检方法,其特征在于,所述的步骤五通过如下方法实现语义分析,设置场景词库模型和质检词库模型两个部分,将步骤3.7所获取的文本信息以及相应的信息节点代号输入到场景词库模型中获取关键词,输出文本信息对应的意图序列;将文本信息以及相应的信息节点代号输入到已训练的质检词库模型中,获取质检意图序列;根据权重综合分析出具体的语义信息。
6.根据权利要求1或者2所述的一种语音通话的智能质检方法,其特征在于,所述的步骤六通过以下步骤实现对分析结论进行质量检测:
步骤6.1设置质检模型:将步骤四中所述情感检测中得到情感状态序列或者步骤五中所述语义分析获得的意图信息输入到质检模型,输出质量预警序列,所述的质量预警序列包括预警类型及概率;
步骤6.2设置质检触发规则:设定不同预警类型对应质检触发阈值;
步骤6.3当步骤6.1中所述所得预警类型及概率达到步骤6.2所述设置的对应质检触发阈值,触发执行反馈处理模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浩琨信息科技有限公司,未经上海浩琨信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911402499.8/1.html,转载请声明来源钻瓜专利网。