[发明专利]一种基于局部注意力机制记忆网络的问答方法及系统在审
| 申请号: | 201910559673.3 | 申请日: | 2019-06-26 |
| 公开(公告)号: | CN110334195A | 公开(公告)日: | 2019-10-15 |
| 发明(设计)人: | 黄仔琪;孙振起 | 申请(专利权)人: | 北京科技大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
| 代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 上下文记忆 模块信息 句子 注意力机制 概率分布 记忆网络 提问 处理效率 模型信息 生成位置 线性门 有效地 多层 色散 答案 传递 引入 预测 保留 | ||
1.一种基于局部注意力机制记忆网络的问答方法,其特征在于,包括以下步骤:
S1、根据提问句子和上下文记忆模块信息生成位置信息;
S2、根据生成的位置信息,计算提问句子和上下文记忆模块信息之间的相关概率分布;
S3、根据计算出的相关概率分布得到预测答案。
2.根据权利要求1所述的问答方法,其特征在于,所述步骤S1包括:
根据以下公式生成位置信息pu:
其中,S是上下文记忆模块的大小,pu∈[0,S];Wa、vp是记忆网络模型训练过程中学习到的参数;q是提问句子中的单词信息,δ是sigmoid激活函数。
3.根据权利要求2所述的问答方法,其特征在于,所述步骤S2包括:
根据以下公式计算相关概率分布pi:
其中D是预设的上下文记忆模块的窗口尺寸。
4.根据权利要求1-3中任一项所述的问答方法,其特征在于,所述问答方法还包括:
在多层结构的记忆网络模型的信息传递过程中,使用线性门控单元对每一层的传递信息进行降低梯度色散的处理。
5.根据权利要求4所述的问答方法,其特征在于,所述线性门控单元根据以下公式对每一层的传递信息进行处理:
其中,W、V、b、c是记忆网络模型训练过程中学习到的参数,是矩阵点积,ok是第k层的输出,uk是第k层的提问句子。
6.一种基于局部注意力机制记忆网络的问答系统,其特征在于,包括:
位置信息生成单元,用于根据提问句子和上下文记忆模块信息生成位置信息;
相关概率分布计算单元,用于根据生成的位置信息,计算提问句子和上下文记忆模块信息之间的相关概率分布;
预测单元,用于根据计算出的相关概率分布得到预测答案。
7.根据权利要求6所述的问答系统,其特征在于,所述问答系统还包括:
线性门控单元,用于在多层结构的记忆网络模型的信息传递过程中,对每一层的传递信息进行降低梯度色散的处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910559673.3/1.html,转载请声明来源钻瓜专利网。





