[发明专利]电力系统的语音导航系统、语音识别方法和语音交互方法在审
申请号: | 201710198667.0 | 申请日: | 2017-03-30 |
公开(公告)号: | CN107093425A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 赵永生;徐海青;吴立刚;袁睿智;梁翀;浦正国;管马舟;陈瑞祥;孙飞;徐唯耀;孔伟伟;林胜;王维佳;许元虎;周小希;宋飞 | 申请(专利权)人: | 安徽继远软件有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/14;G10L15/06;G10L15/00;G01C21/20 |
代理公司: | 温州市品创专利商标代理事务所(普通合伙)33247 | 代理人: | 程春生 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力系统 语音 导航系统 识别 方法 交互 | ||
1.一种电力系统的语音导航系统,其特征在于:包括
语音输入模块:客户通过手机或者固话,利用排队机接入呼叫中心系统,在CTI和IVR的控制下,当用户需要语音导航业务时,通过呼叫平台实现话务接入,平台记录下的原始语音信息,并进行播报用户确认无误后,将该文件作为原始的语音文件信息输入;
语音识别模块包括语音识别单元和语音文本处理单元;
语音识别单元:语音识别引擎输入的原始的语音文件信息经过语音识别预处理;将经过语音识别预处理的语音文件进行离线解码或在线解码、置信度处理后转成自然语言文本信息;并将原始语音信息、原始的语音文件信息、语音特征信息存入文本/语音语库中;
语音文本处理单元:将自然语言文本信息经过模式匹配处理、语法分析处理、语义解析处理、语义搜索处理、上下文管理处理以及语义预测处理后,将自然语言文本信息转换成计算机识别的语音信息作为输出物;进行业务需求分析,为自然语言处理引擎提供数据输入;
数据交互模块,为用户输入的数据、系统识别的数据和反馈客户输出的数据提供交互。
2.根据权利要求1所述的一种电力系统的语音导航系统,其特征在于:在语音识别单元中进行的语音识别预处理包括特征提取处理、端点检测处理和去燥处理。
3.根据权利要求1所述的一种电力系统的语音导航系统,其特征在于:还包括语音反馈模块,用于反馈噪音或非普通话输入的原始语音信息。
4.根据权利要求1所述的一种电力系统的语音导航系统,其特征在于:语音识别模块中,语音识别处理的步骤为:
(41)初始化原始的语音文件信息;
(42)创建识别引擎;语音识别引擎用于输入的原始的语音文件;
(43)创建识别上下文接口;
(44)设置识别消息;
(45)设置事件;
(46)创建语法规则;
(47)激活语法规则:
(48)获取识别消息,进行处理。
5.如权利要求1-4任一所述的电力系统的语音导航系统的语音识别方法,其特征在于,语音识别单元采用深度神经网络和隐马尔科夫(DNN-HMM)混合模型,使用HMM来描述语音信号的动态变化,再使用DNN的每个输出节点来估计连续密度HMM的某个状态的后验概率。
6.根据权利要求5所述的电力系统的语音导航系统的语音识别方法,其特征在于:离线解码或在线解码中:
(61)首先将后验概率转为似然度p(Xt/qt):
p(Xt/qt=s)=p(qt=s/Xt)p(Xt)/p(s) (1)
其中,是从训练集中统计的每个状态的先验概率,Ts是标记属于状态s的帧数,T是总帧数,
(62)p(Xt)与字词序列无关,计算时可以忽略,忽略后得到缩放的似然度
(63)在DNN-HMM模型中,解码出的字词序列由以下公式确定:
其中p(ω)是语言模型(LM)概率,以及
上式是声学模型(AM)概率,其中,p(qt/xt)由DNN模型计算得出,p(qt)是状态的先验概率,π(q0)和分别是初始状态概率和状态转移概率,
(64)语言模型权重系数λ通常被用于平衡声学和语言模型得分,最终的解码路径由以下公式决定:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽继远软件有限公司,未经安徽继远软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198667.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:机器人走柔性钢丝绳实验测试平台
- 下一篇:一种住院部用药片配药机器人