[发明专利]阅读机器人进行阅读理解的答案选择方法及系统有效
申请号: | 201711092170.7 | 申请日: | 2017-11-08 |
公开(公告)号: | CN107818085B | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 李茹;郭少茹;张旗;王智强;关勇 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 李广 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 阅读 机器人 进行 理解 答案 选择 方法 系统 | ||
本发明公开了一种阅读机器人进行阅读理解的答案选择方法及系统,为了提高机器人在进行阅读理解的答案选择时的正确率而设计。本发明阅读机器人进行阅读理解的答案选择方法,包括定位包含与题干相关的段落;采用词袋模型,抽取和选项有最多匹配词数的句子作为证据材料;分析选项与证据材料语义一致性;根据一致性分析结果,选取问题的最佳答案。本发明能够应用于阅读机器人,通过自动分析、推理,实现答案选择题目智能解答。
技术领域
本发明涉及自然语言处理研究领域,具体涉及一种阅读机器人进行阅读理解的答案选择方法及系统。
技术背景
阅读理解是人们从大量文本中获取信息的重要途径,很多时候用户并不想浏览全文,而是想知道某个问题的确切答案,阅读理解问答技术由此应运而生。在阅读理解问答中,有一种类型为选择型阅读理解,即基于阅读理解的背景材料提出一个问题,并提供针对该问题的多个选项,要求计算机能够自动地“阅读”完一篇材料后,根据对材料的“理解”从多个候选答案中选择正确的答案。在自然语言领域中,解答选择型阅读理解的方法直接影响选择出的答案的正确性。
目前,针对答案选择型题目,主要采用基于相似或相关性来确定正确答案的方法,此类方法通过计算选项与背景材料的句子之间的最相似或相关性来确定正确答案,然而,在语义上等价的句子往往会用不同的句法结构形式来表述,基于相似度与相关性的方法只能找到背景材料中与选项语法结构或语义表述相似度较高的句子,无法理解语义的细微差别,而句子间的细微差别是语言处理第一要务。同时,此类方法通过分析选项与整篇背景材料的相关性,但选项往往与文章中一句或几句话相关,因此,将选项与全文进行分析,引入了大量的噪声数据,影响答题准确率。
发明内容
本发明克服现有技术存在的不足,旨在提供一种具有实现复杂语言语义推理的能力的阅读机器人进行阅读理解的答案选择方法及系统。
本发明阅读机器人进行阅读理解的答案选择方法,包括:
获取阅读理解文档、题干以及各题干对应的多个选项,基于主题推理模型获取阅读理解文档中各个段落的主题,定位包含与题干相关的段落;
基于已定位的相关段落,采用词袋(bag-of-words,BOW)模型,抽取与选项有最多匹配词数的句子作为证据材料;
分析选项与证据材料语义一致性;
根据选项与证据材料语义一致性分析结果,从多个选项中选择针对题干的正确选项。
进一步地,基于汉语框架网的语义场景标注,对选项及证据材料中的句子进行分词,并根据汉语句子框架元素标注规范,使用预先设置的汉语框架网语义资源库对选项和证据材料中的句子进行多重标注,得到句子中的目标词及目标词所激起的框架,并对框架所包含的框架元素进行标注,分别将选项表示为选项框架语义依存图、将证据材料表示为证据材料框架语义依存图的形式;
分析选项框架语义依存图与证据材料框架语义依存图之间的结构关系:提取证据材料框架语义依存图与选项框架语义依存图结构相似的部分;基于提取的选项框架语义依存图和证据材料的框架语义依存图,根据汉语框架语义网中的框架关系,计算两个框架语义依存图中结构相似部分框架之间的语义路径;基于Word2Vector计算选项框架语义依存图及证据材料框架语义依存图中叶子结点框架元素的语义一致性;递归的分析选项框架语义依存图及证据材料框架语义依存图非叶子结点框架元素一致性。
进一步地,所述的定位包含与题干相关的段落的具体方法包括:
采用基于LDA算法依次获取阅读理解文档中各个段落的主题,采用淘汰策略提取题干的核心信息,即淘汰掉题干中次要的、支撑的、解说的信息,保留与文章内容相关的信息;将题干核心信息与获取的文章各段落主题依次进行相关度计算,相关度计算采用基于Word2Vector语义相关度计算方法;采用排序算法将问题从全文定位到与题干核心信息相关的段落。
进一步地,证据材料获取单元包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711092170.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融合点评配图的情感分析方法
- 下一篇:一种数字出版物语义标注优化方法