[发明专利]一种基于条件随机场结构化注意力网络的对话行为识别方法及系统在审
| 申请号: | 201810443182.8 | 申请日: | 2018-05-10 |
| 公开(公告)号: | CN108829662A | 公开(公告)日: | 2018-11-16 |
| 发明(设计)人: | 陈哲乾;蔡登;杨荣钦;赵洲;何晓飞 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/04;G06N3/08 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
| 地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对话 对话内容 行为识别 注意力 基于条件 机场结构 网络 条件随机场算法 结构化信息 上下文信息 上下文语境 记忆网络 交互过程 线性条件 应用结构 语义建模 语义信息 准确度 单词层 结构化 句子层 分层 算法 推理 小节 捕捉 预测 机场 应用 | ||
1.一种基于条件随机场结构化注意力网络的对话行为识别方法,其特征在于,包括以下步骤:
(1)结合记忆网络,将对话语义信息按照单词层、句子层、对话层进行分层推理,语义建模;
(2)应用结构化注意力网络,根据对话内容之间的相关性,对对话内容进行结构小节划分;
(3)将得到的结构化信息应用于线性条件随机场算法上,根据上下文语境预测当前对话行为。
2.根据权利要求1所述的基于条件随机场结构化注意力网络的对话行为识别方法,其特征在于,步骤(1)中,所述对话语义信息的单词层推理公式如下:
E=fconcat(Ew,Ea,Epos,Ener)
其中,E为单词最终的完整向量表示,由四种不同维度单词信息拼接而成,fconcat是拼接的函数表示,Ew表示单词从谷歌预训练好的英文词向量模型得到的Word2vec向量;Ea表示由字母组合信息通过循环神经网络学习到的单词表示向量;表示该单词组成的各个字母;Epos表示nltk工具包处理后的单词词性信息;Ener表示nltk工具包处理后的单词实体类别信息。
3.根据权利要求1所述的基于条件随机场结构化注意力网络的对话行为识别方法,其特征在于,步骤(1)中,所述对话语义信息的对话层推理具体步骤如下:
(1-1)采用双向门控循环单元,将每个单词的前向隐含表示和后向隐含表示拼接,得到整个句子的空间语义向量表示,公式为:
U=fbiGRU(E1,…,En)
其中,U表示整个句子的空间语义向量表示,Ei表示句子中第i个单词;
(1-2)获得当前句子在上下文语境中的语义表示,公式为:
Ct=tanh(Wm-1Ct-1+Wm+1Ct+1+bm)
其中,Ct表示为第t句话在上下文语境中的语义表示,Ct-1和Ct+1为前句话和后句话隐含表示,Wm-1,Wm+1,bm是训练得到的参数,Tanh是激活函数;
(1-3)采用记忆神经网络,结合注意力机制对两种对话表示进行整合,得到最终融合的对话语义信息。
4.根据权利要求3所述的基于条件随机场结构化注意力网络的对话行为识别方法,其特征在于,步骤(1-3)的具体步骤如下:
(1-3-1)通过softmax归一化得到原始句子表示Ut和上下文语境中的语义表示Ct之间的相关性:
其中,表示为句子原始向量表示的转置向量,pj,i表示原始句子表示Ut和上下文语境中的语义表示Ct之间的相关性;
(1-3-2)引入记忆网络生成最终的记忆输出Ot:
(1-3-3)经过k层记忆网络之后,采用堆栈操作,将上一层的输出与相加,得到下一层的句子最终表示,具体公式为:
其中,表示受上一次记忆网络的影响,得到的对话句子最终语义理解表示。
5.根据权利要求1所述的基于条件随机场结构化注意力网络的对话行为识别方法,其特征在于,步骤(2)中,所述的结构小节包括打招呼小节、聊天小节、问答小节和告别小节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810443182.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于模糊匹配的新闻主体名称提取方法
- 下一篇:一种文章评估方法及系统





