[发明专利]一种观点型机器阅读理解的实现方法、装置在审
申请号: | 201910481171.3 | 申请日: | 2019-06-04 |
公开(公告)号: | CN110390001A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 杨志明 | 申请(专利权)人: | 深思考人工智能机器人科技(北京)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N5/04 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100084 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 上下文信息 候选答案 加权 抽取 编码结果 动态路由 聚类信息 聚类中心 信息抽取 阅读 动态的 选择型 正确率 迭代 向量 语境 匹配 答案 输出 融合 申请 | ||
本申请公开了一种观点型机器阅读理解的实现方法,该方法包括,分别对各个上下文词向量的融合结果进行信息抽取,获得基于问题抽取的上下文信息,以候选答案语境化编码结果为聚类中心,以所述基于问题抽取的上下文信息为聚类信息,进行动态路由迭代,输出基于上下文信息加权的候选答案,从所述基于上下文信息加权的候选答案识别出最佳候选答案。本发明为动态的选择型问题匹配最佳的答案,正确率高。
技术领域
本发明涉及机器理解领域,特别地,涉及一种观点型机器阅读理解的实现方法。
背景技术
在机器理解中,有时需要结合上下文信息进行推理,才可以获得正确的理解结果。例如,今天是不是在下雨?感冒吃小柴胡好还是吃感冒灵颗粒好?此类问题需要结合上下文信息进行推理,才可以得到答案。
观点型问题主要包括两面性问题和选择型问题,前者指“是不是”、“可不可以”等具备【A或不A】特性的问题,后者指“小柴胡还是感冒灵”、“苹果还是雪梨”等具备【A或B】特性的问题。
现有阅读理解模型往往为抽取型阅读理解模型,对问题和上下文进行信息处理,经过词嵌入、编码、匹配、融合等流程后,采用指针网(pointer net)从上下文中截取出答案,具体实现如:模型化句子对的多路注意力网络(Multiway Attention Networks forModeling Sentence Pairs)、BiDAF、R-net等。
观点型阅读理解的解决方案沿用了普通阅读理解模型的前四步,即词嵌入、编码、匹配、融合,最后,根据问题直接从上下文抽出的向量表示,与编码后的候选答案进行矩阵乘法,得出每个候选答案作为答案的概率。这种方式将候选答案独立于上下文之外,更容易解决【A、B、无法确定】型分类问题,但由于观点型问题的答案往往是动态的、需要推理的,现有解决方案大多数趋向于分类,采用分类的思想并不能动态地融入候选观点知识信息和动态地推理答案,这样,对于动态的选择型问题却往往很难得到理想答案。
发明内容
本发明提供了一种观点型机器阅读理解的实现方法,以为动态的选择型问题匹配最佳的答案。
本发明提供的一种观点型机器阅读理解的实现方法是这样实现的:
将自然语言文本所包括的上下文、问题、以及候选答案分别转化为词向量表示,分别获得上下文词向量、问题词向量、候选答案词向量;
对上下文词向量、问题词向量、候选答案词向量分别进行语境化编码,分别获得上下文语境化编码结果、问题语境化编码结果、候选答案语境化编码结果;
将上下文语境化编码结果与问题语境化编码结果进行匹配,获得上下文与问题的匹配结果;
将各个上下文词向量、上下文语境化编码结果、以及上下文与问题的匹配结果进行融合,获得各个上下文词向量的融合结果;
分别对各个上下文词向量的融合结果进行信息抽取,获得基于问题抽取的上下文信息,
以候选答案语境化编码结果为聚类中心,以所述基于问题抽取的上下文信息为聚类信息,进行动态路由迭代,输出基于上下文信息加权的候选答案,
从所述基于上下文信息加权的候选答案识别出最佳候选答案。
其中,所述对上下文词向量、问题词向量、候选答案词向量分别进行语境化编码,包括,
通过双向长短时记忆神经网络结构对问题词向量进行编码,得到问题语境化编码结果;
将对问题词向量编码过程中双向长短时记忆神经网络中隐藏层状态信息作为上下文、候选答案的LSTM神经网络编码的初始化状态信息,通过双向LSTM神经网络结构对上下文、候选答案分别进行编码,分别获得上下文语境化编码结果、问候选答案语境化编码结果,并将问候选答案语境化编码结果作为胶囊网络结构中的初始胶囊。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技(北京)有限公司,未经深思考人工智能机器人科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910481171.3/2.html,转载请声明来源钻瓜专利网。