[发明专利]电力系统的语音导航系统、语音识别方法和语音交互方法在审

申请号：	201710198667.0	申请日：	2017-03-30
公开（公告）号：	CN107093425A	公开（公告）日：	2017-08-25
发明（设计）人：	赵永生;徐海青;吴立刚;袁睿智;梁翀;浦正国;管马舟;陈瑞祥;孙飞;徐唯耀;孔伟伟;林胜;王维佳;许元虎;周小希;宋飞	申请（专利权）人：	安徽继远软件有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/16;G10L15/14;G10L15/06;G10L15/00;G01C21/20
代理公司：	温州市品创专利商标代理事务所(普通合伙)33247	代理人：	程春生
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	电力系统语音导航系统识别方法交互
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种电力系统的语音导航系统，其特征在于：包括

语音输入模块：客户通过手机或者固话，利用排队机接入呼叫中心系统，在CTI和IVR的控制下，当用户需要语音导航业务时，通过呼叫平台实现话务接入，平台记录下的原始语音信息，并进行播报用户确认无误后，将该文件作为原始的语音文件信息输入；

语音识别模块包括语音识别单元和语音文本处理单元；

语音识别单元：语音识别引擎输入的原始的语音文件信息经过语音识别预处理；将经过语音识别预处理的语音文件进行离线解码或在线解码、置信度处理后转成自然语言文本信息；并将原始语音信息、原始的语音文件信息、语音特征信息存入文本/语音语库中；

语音文本处理单元：将自然语言文本信息经过模式匹配处理、语法分析处理、语义解析处理、语义搜索处理、上下文管理处理以及语义预测处理后，将自然语言文本信息转换成计算机识别的语音信息作为输出物；进行业务需求分析，为自然语言处理引擎提供数据输入；

数据交互模块，为用户输入的数据、系统识别的数据和反馈客户输出的数据提供交互。

2.根据权利要求1所述的一种电力系统的语音导航系统，其特征在于：在语音识别单元中进行的语音识别预处理包括特征提取处理、端点检测处理和去燥处理。

3.根据权利要求1所述的一种电力系统的语音导航系统，其特征在于：还包括语音反馈模块，用于反馈噪音或非普通话输入的原始语音信息。

4.根据权利要求1所述的一种电力系统的语音导航系统，其特征在于：语音识别模块中，语音识别处理的步骤为：

(41)初始化原始的语音文件信息；

(42)创建识别引擎；语音识别引擎用于输入的原始的语音文件；

(43)创建识别上下文接口；

(44)设置识别消息；

(45)设置事件；

(46)创建语法规则；

(47)激活语法规则：

(48)获取识别消息，进行处理。

5.如权利要求1-4任一所述的电力系统的语音导航系统的语音识别方法，其特征在于，语音识别单元采用深度神经网络和隐马尔科夫(DNN-HMM)混合模型，使用HMM来描述语音信号的动态变化，再使用DNN的每个输出节点来估计连续密度HMM的某个状态的后验概率。

6.根据权利要求5所述的电力系统的语音导航系统的语音识别方法，其特征在于：离线解码或在线解码中：

(61)首先将后验概率转为似然度p(X_t/q_t)：

p(X_t/q_t＝s)＝p(q_t＝s/X_t)p(X_t)/p(s) (1)

其中，是从训练集中统计的每个状态的先验概率，T_s是标记属于状态s的帧数，T是总帧数，

(62)p(X_t)与字词序列无关，计算时可以忽略，忽略后得到缩放的似然度

(63)在DNN-HMM模型中，解码出的字词序列由以下公式确定：

其中p(ω)是语言模型(LM)概率，以及

上式是声学模型(AM)概率，其中，p(q_t/x_t)由DNN模型计算得出，p(q_t)是状态的先验概率，π(q₀)和分别是初始状态概率和状态转移概率，

(64)语言模型权重系数λ通常被用于平衡声学和语言模型得分，最终的解码路径由以下公式决定：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽继远软件有限公司，未经安徽继远软件有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710198667.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载