[发明专利]一种机器阅读理解方法有效

专利信息
申请号: 201910887852.X 申请日: 2019-09-19
公开(公告)号: CN110619123B 公开(公告)日: 2021-01-26
发明(设计)人: 李建平;顾小丰;胡健;孙睿男;冯文婷;李顺利;蒋胜 申请(专利权)人: 电子科技大学
主分类号: G06F40/30 分类号: G06F40/30;G06F40/126;G06F16/35
代理公司: 成都正华专利代理事务所(普通合伙) 51229 代理人: 陈选中
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 机器 阅读 理解 方法
【权利要求书】:

1.一种机器阅读理解方法,其特征在于,包括以下步骤:

S1、分别对问题和文章进行编码,分别得到问题和文章的字符级表示向量;

S2、将问题和文章的字符级表示向量进行编码,分别得到编码后的问题向量和文章向量;

S3、将编码后的文章向量输入双向注意力模型,将编码后的问题向量输入共同注意力模型,分别得到双向注意力模型的输出P1和共同注意力模型的输出P2;

S4、根据聚合机制将双向注意力模型的输出P1和共同注意力模型的输出P2进行聚合,得到聚合后的向量P3;

S5、将聚合后的向量P3与编码前的文章向量P进行聚合,得到文本编码向量P4;

S6、基于文本编码向量P4,根据自注意力模型获取文章内部单词之间的全局交互信息;

S7、根据全局交互信息和文本编码向量P4获取使用自注意力模型后的文本向量P5;

S8、根据聚合函数将文本编码向量P4和使用自注意力模型后的文本向量P5进行聚合,得到聚合后的数据P6;

S9、将聚合后的数据P6与编码前的文章向量P进行拼接,并将拼接后的数据作为输入送入双向GRU网络中,将双向GRU网络的输出作为文章的上下文语境向量;

S10、根据文章的上下文语境向量和编码后的问题向量分别预测文本中每一个位置是起始索引和结束索引的概率,将起始索引与结束索引概率最大的结果作为答案位置,完成机器阅读理解。

2.根据权利要求1所述的机器阅读理解方法,其特征在于,所述步骤S1的具体方法包括以下子步骤:

S1-1、将问题和文章中的每一个单词m表示为一个字符序列(c1,...,c|m|),并将词表中的每一个单词表示为dc维的向量;

S1-2、将每一个单词序列应用一个大小为的卷积核,采用公式

fi=tanh(wTci:i+w-1+b)

获取特征向量fi;其中tanh(·)为双曲正切函数;ci:i+w-1为字符序列段;b为偏差参数;(·)T为矩阵的转置;为数域;

S1-3、对所有的特征向量进行最大池化操作,分别得到问题和文章的字符级表示向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910887852.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top