[发明专利]一种基于深度学习的意图识别方法有效
| 申请号: | 201810945991.9 | 申请日: | 2018-08-20 |
| 公开(公告)号: | CN109241255B | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 何婷婷;潘敏;汤丽;王逾凡;孙博 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 意图 识别 方法 | ||
1.一种基于深度学习的对话系统意图识别方法,其特征在于:首先,从对话语料中通过词频权重抽取关键词作为意图识别的规则,将预进行意图识别的对话D用规则进行匹配得到意图分类结果PA;用对话语料训练深度学习模型CNN-BLSTM,所述深度学习模型CNN-BLSTM融合了卷积神经网络CNN与双向长短期记忆网络BLSTM,然后用训练后的深度学习模型CNN-BLSTM,识别对话D,得到意图分类结果PB;最后,通过将意图分类结果PA和意图分类结果PB进行线性融合,得到对话D最终的意图;
所述用对话语料训练深度学习模型CNN-BLSTM,实现方式如下,
将训练语料进行分词处理后,将分词后所得的每句话中的每个词的向量表示xb组合成该句话的向量表示X=[x1,x2,x3,…xl],l为向量的序列长度,b=1,2,3...l;
将句子的向量X输入卷积神经网络的卷积层计算,将得到的所有特征图sa组合起来得到输出结果S=[s1,s2,s3...sn],n表示特征图的总个数,a=1,2,3…n;
对S的结构进行重新排列,将重排列后所得向量V输入BLSTM神经网络模型中,BLSTM是双向长短期记忆神经网络,由一个前向的长短期记忆神经网络和一个后向的长短期记忆神经网络构成;对于每一个时间步t,前向的长短期记忆神经网络输出隐层状态后向的长短期记忆神经网络输出隐层状态组合两个隐层状态的向量得到向量ht;根据所有时间步的向量表示,得到整个句子相应的向量H,H中隐含上下文语义信息;
对S进行最大池化操作后得到向量O,O中包含句子中最重要的语义特征和类别特征信息;
将向量H和向量O拼接起来作为向量T,
将T作为最终对话句子特征向量表示,连接所有的句子特征T得到中间量yc,根据yc得到每个类别的概率,选取概率最大的意图类别作为意图识别结果PB。
2.根据权利要求1所述基于深度学习的对话系统意图识别方法,其特征在于:所述从对话语料中通过词频权重抽取关键词作为意图识别的规则,包括对每个类别进行以下处理,
进行分词处理,并统计得到该类别下所有词条的数目N,将所有的词条组成一个词表,并统计出该类别中,第i个词出现的次数Wi、句子的总条数M以及第j条句子的长度Lj,i=1,2,3…N,j=1,2,3…M;
计算出该类别下句子的平均长度AveL,计算公式如下,
计算出第i个词的词频权重Fi如下,
其中,∑S表示对该类别中所有出现第i个词的句子的长度S累加求和;
对该类别下的每一个词求得词频权重后,将词表中的每个词条按词频权重从大到小排序,提出选取排名在前的若干词条作为关键词,作为该类别的规则。
3.根据权利要求1或2所述基于深度学习的对话系统意图识别方法,其特征在于:设将意图分类结果PA和意图分类结果PB进行线性融合后得到最终的意图类别概率分布P,在P中选取概率最大所对应的意图类别作为最终意图识别的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810945991.9/1.html,转载请声明来源钻瓜专利网。





