[发明专利]一种基于端到端的应用于电力企业客服的语音导航方法在审
申请号: | 201911247567.8 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111312228A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 胡飞飞;洪丹轲;黄昱;曾时博;刘丽;舒然;范俊成;梁寿愚;王科;张坤;方文崇 | 申请(专利权)人: | 中国南方电网有限责任公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/183;G06N3/04 |
代理公司: | 武汉维创品智专利代理事务所(特殊普通合伙) 42239 | 代理人: | 邓骏杰 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 端到端 应用于 电力企业 客服 语音 导航 方法 | ||
1.一种基于人工智能的应用于电力电网领域的语音导航方法,其特征在于:
(1)在语音识别模型中使用语音数据作为语音识别模型的输入,通过自编码网络提取出语音数据特征;
(2)在提取语音数据特征的过程中,使用带有注意力机制的门控循环卷积神经网络(GRU)提取出语音和文本的信息,生成一个定长的上下文向量;
(3)在用于提取语音数据特征的第一门控循环卷积神经网络后连接解码器,所述解码器采用第二门控循环卷积神经网络,所述解码器将所述上下文向量转变为一段边长序列;
(4)将所述边长序列和数据库进行对比,得到需要回答的回答语音序列并输出语音。
2.根据权利要求1所述的基于人工智能的应用于电力电网领域客服领域的语音导航方法,其特征在于:所述语音识别模型中语音数据和对应的文本预料数据使用了基于门控卷积循环网络的编码器结构,所述编码器结构把一个不定长的输入序列转化成一个定长的上下文向量c,并在该过程中,将序列中的信息全部压缩到一个定长向量中,门控循环卷积网络的前向传播公式如下:
rt=σ(Wr·[ht-1,xt])
zt=σ(Wz·[ht-l,xt])
yt=σ(Wo·ht)
其中h,x为输入序列;r为重置门;z为更新门;t代表每个序列下标;y为序列输出,W为学习的权重;
上下文向量表示如下式:
c=q(h1,h2,…,hTx)
其中q为网络的最后一个隐含状态;h为序列中会产生的一个隐含状态;Tx代表总的序列个数。
3.根据权利要求1所述的基于端到端的应用于电力企业客服的语音导航方法,其特征在于:使用带有注意力机制的门控卷积循环网络通过注意力机制寻找出语音数据的上下文向量序列,在解码过程中注意力机制会在上下文向量序列中选取当前时刻需要关注的部分,其中公式表示为:
yj=g(yj-1,Sj,cj)
Sj=f(yj-1,Sj-1,Cj)
其中y为输出;s为解码器第j步的隐藏状态;c为第j步的注意力向量,α为注意力权重;h为每个序列的隐状态;Tx代表总的序列个数。
4.根据权利要求1所述的基于端到端的应用于电力企业客服的语音导航方法,其特征在于:在门控循环网络后加入解码器提取特征,提取的特征的函数如下:
yj=g(y1,y2,…yj-1,c)=g(yj-1,sj,i)
y为解码时第j步的输出,s为j时刻循环神经网络的隐状态,c为上下文向量;
在训练中损失函数使用交叉熵损失函数,能使网络模型达到更小的错误率,交叉熵损失函数L如下:
其中i表示第i个样本;l是第i个样本的标签;f表示第i个样本预测为第j个标签的概率。
5.根据权利要求1所述的基于端到端的应用于电力企业客服的语音导航方法,其特征在于:在上述步骤解码器屈的语音序列后和数据库进行对比匹配,得到文本序列。
6.根据权利要求1所述的基于端到端的应用于电力企业客服的语音导航方法,其特征在于:在得到文本序列后通过带有多头注意力机制的WaveNet构成的声码器以合成相应的语音,多头注意力机制数学表达式如下:
head=Attention(DQi+FQi+GQi)
MultiHead(D,F,G)=concat(head1,head2,...,headi)Q
D为当前时间步的解码器输入,F为编码器输出,G为累加注意力权重,Q为待训练参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司,未经中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911247567.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:低阻抗显示器
- 下一篇:一种再生铝的浇铸装置