[发明专利]一种机器阅读理解方法有效
| 申请号: | 201910887852.X | 申请日: | 2019-09-19 |
| 公开(公告)号: | CN110619123B | 公开(公告)日: | 2021-01-26 |
| 发明(设计)人: | 李建平;顾小丰;胡健;孙睿男;冯文婷;李顺利;蒋胜 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/126;G06F16/35 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器 阅读 理解 方法 | ||
本发明公开了一种机器阅读理解方法,其包括以下步骤:S1、得到问题和文章的字符级表示向量;S2、得到编码后的问题向量和文章向量;S3、得到双向注意力模型的输出P1和共同注意力模型的输出P2;S4、得到聚合后的向量P3;S5、得到文本编码向量P4;S6、获取文章内部单词之间的全局交互信息;S7、获取使用自注意力模型后的文本向量P5;S8、根据P4和P5得到聚合后的数据P6;S9、根据P6和P得到文章的上下文语境向量;S10、根据文章的上下文语境向量和编码后的问题向量预测答案位置,完成机器阅读理解。本发明可快速进行文章阅读理解,并从文章中给出问题的答案。
技术领域
本发明涉及人工智能领域,具体涉及一种机器阅读理解方法。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
机器阅读理解是认知环节的关键能力之一,机器阅读理解的发展可推进人工智能的发展。
发明内容
针对现有技术中的上述不足,本发明提供的一种机器阅读理解方法可快速进行文章阅读理解,并从文章中给出问题的答案。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种机器阅读理解方法,其包括以下步骤:
S1、分别对问题和文章进行编码,分别得到问题和文章的字符级表示向量;
S2、将问题和文章的字符级表示向量进行编码,分别得到编码后的问题向量和文章向量;
S3、将编码后的文章向量输入双向注意力模型,将编码后的问题向量输入共同注意力模型,分别得到双向注意力模型的输出P1和共同注意力模型的输出P2;
S4、根据聚合机制将双向注意力模型的输出P1和共同注意力模型的输出P2进行聚合,得到聚合后的向量P3;
S5、将聚合后的向量P3与编码前的文章向量P进行聚合,得到文本编码向量P4;
S6、基于文本编码向量P4,根据自注意力模型获取文章内部单词之间的全局交互信息;
S7、根据全局交互信息和文本编码向量P4获取使用自注意力模型后的文本向量P5;
S8、根据聚合函数将文本编码向量P4和使用自注意力模型后的文本向量P5进行聚合,得到聚合后的数据P6;
S9、将聚合后的数据P6与编码前的文章向量P进行拼接,并将拼接后的数据作为输入送入双向GRU网络中,将双向GRU网络的输出作为文章的上下文语境向量;
S10、根据文章的上下文语境向量和编码后的问题向量分别预测文本中每一个位置是起始索引和结束索引的概率,将起始索引与结束索引概率最大的结果作为答案位置,完成机器阅读理解。
进一步地,步骤S1的具体方法包括以下子步骤:
S1-1、将问题和文章中的每一个单词m表示为一个字符序列(c1,...,c|m|),并将词表中的每一个单词表示为dc维的向量;
S1-2、将每一个单词序列应用一个大小为的卷积核,采用公式
fi=tanh(wTci:i+w-1+b)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910887852.X/2.html,转载请声明来源钻瓜专利网。





