[发明专利]一种机器阅读理解方法有效
| 申请号: | 201910887852.X | 申请日: | 2019-09-19 |
| 公开(公告)号: | CN110619123B | 公开(公告)日: | 2021-01-26 |
| 发明(设计)人: | 李建平;顾小丰;胡健;孙睿男;冯文婷;李顺利;蒋胜 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/126;G06F16/35 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器 阅读 理解 方法 | ||
1.一种机器阅读理解方法,其特征在于,包括以下步骤:
S1、分别对问题和文章进行编码,分别得到问题和文章的字符级表示向量;
S2、将问题和文章的字符级表示向量进行编码,分别得到编码后的问题向量和文章向量;
S3、将编码后的文章向量输入双向注意力模型,将编码后的问题向量输入共同注意力模型,分别得到双向注意力模型的输出P1和共同注意力模型的输出P2;
S4、根据聚合机制将双向注意力模型的输出P1和共同注意力模型的输出P2进行聚合,得到聚合后的向量P3;
S5、将聚合后的向量P3与编码前的文章向量P进行聚合,得到文本编码向量P4;
S6、基于文本编码向量P4,根据自注意力模型获取文章内部单词之间的全局交互信息;
S7、根据全局交互信息和文本编码向量P4获取使用自注意力模型后的文本向量P5;
S8、根据聚合函数将文本编码向量P4和使用自注意力模型后的文本向量P5进行聚合,得到聚合后的数据P6;
S9、将聚合后的数据P6与编码前的文章向量P进行拼接,并将拼接后的数据作为输入送入双向GRU网络中,将双向GRU网络的输出作为文章的上下文语境向量;
S10、根据文章的上下文语境向量和编码后的问题向量分别预测文本中每一个位置是起始索引和结束索引的概率,将起始索引与结束索引概率最大的结果作为答案位置,完成机器阅读理解。
2.根据权利要求1所述的机器阅读理解方法,其特征在于,所述步骤S1的具体方法包括以下子步骤:
S1-1、将问题和文章中的每一个单词m表示为一个字符序列(c1,...,c|m|),并将词表中的每一个单词表示为dc维的向量;
S1-2、将每一个单词序列应用一个大小为的卷积核,采用公式
fi=tanh(wTci:i+w-1+b)
获取特征向量fi;其中tanh(·)为双曲正切函数;ci:i+w-1为字符序列段;b为偏差参数;(·)T为矩阵的转置;为数域;
S1-3、对所有的特征向量进行最大池化操作,分别得到问题和文章的字符级表示向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910887852.X/1.html,转载请声明来源钻瓜专利网。





