[发明专利]生成阅读理解的问题题目的方法、装置、设备及存储介质在审
申请号: | 202010103758.3 | 申请日: | 2020-02-19 |
公开(公告)号: | CN111428467A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 王燕蒙;许开河;王烨;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06F40/30;G06F16/33;G06K9/62;G06Q50/20 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 肖丹 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 阅读 理解 问题 题目 方法 装置 设备 存储 介质 | ||
本发明公开了一种生成阅读理解的问题题目的方法、装置、设备及存储介质;本发明首先获取待处理的阅读理解源文本,对阅读理解源文本按照词组类型进行分词处理,使得阅读理解源文本具有多个不同词组类型的特征词组;从所述词组类型中确定目标词组类型,从预设存储区域中获取与目标词组类型对应的预设目标答案向量;从各特征词组中选取与目标词组类型对应的目标特征词组,生成与目标特征词组对应的目标词向量;获取目标特征词组在阅读理解源文本中的位置信息,生成与位置信息对应的位置向量;将与目标词组类型对应的目标词向量、位置向量、以及预设目标答案向量送入预设序列到序列模型中,最后自动生成更加贴合阅读理解源文本本意的问题题目文本。
技术领域
本发明涉及大数据分析领域,尤其涉及一种生成阅读理解的问题题目的方法、装置、设备及存储介质。
背景技术
从学校教育到职业培训,无论是语言学习还是特定学科和技术的学习,都离不开文本文献的阅读和理解能力。要提高阅读能力,需要学生大量进行阅读并根据相关内容回答问题,提高对文章的理解能力,更重要的是老师需要一种可靠的手段检查学生是否阅读了老师指定的篇章,掌握学生的学习进度,并根据效果安排调整学习计划。传统方法都是人工出题,看学生是否能够正确回答相关问题。伴随着新教材和文章的涌现,人工出题耗时耗力,检查流程无法实现自动化。
目前,越来越多的神经网络被成功的应用于问答系统和其他的阅读理解任务,甚至在某些方面已经超越了人类,但是它们在达到较好水平的同时需要大量的数据来进行支持,而这些数据如果全部通过人工标注又过于需要人力。于是,文本生成问题技术应运而生,问题生成技术要解决的是通过一段文字来生成与之对应的问题,可用于数据增强、对话系统,同时对阅读理解有很大的帮助,针对一段文本生成问题,以用于数据增强、对话系统、阅读理解。
但是,现有技术中基于文章阅读理解文本生成问题这项技术通常为基于种子词使用模板来进行扩展和检查,这种生成方式容易出现没有结合文本原文本意的现象,通过这种方式生成的问题可能会存在可以从文章中找到多种答案的情况,即通过这种方式生成的文本句式过于单一化,生成的问题过于简单,无法有效地替代人工出题,效果不理想。
发明内容
本发明的主要目的在于提供了一种生成阅读理解的问题题目的方法、装置、设备及存储介质,旨在解决目前利用现有技术来自动生成阅读理解的问题题目过于单一化,生成的问题过于简单,效果不理想,无法有效地替代人工出题的技术问题。
为实现上述目的,本发明提供了一种生成阅读理解的问题题目方法,所述方法包括以下步骤:
获取待处理的阅读理解源文本;
对所述阅读理解源文本按照词组类型进行分词处理,使得所述阅读理解源文本具有多个不同词组类型的特征词组;
从所述词组类型中确定目标词组类型,从预设存储区域中获取与所述目标词组类型对应的预设目标答案向量,所述目标词组类型与所述预设目标答案向量存在预设映射关系;
从各特征词组中选取与所述目标词组类型对应的目标特征词组,生成与所述目标特征词组对应的目标词向量;
获取所述目标特征词组在所述阅读理解源文本中的位置信息,生成与所述位置信息对应的位置向量;
将与所述目标词组类型对应的所述目标词向量、所述位置向量、以及所述预设目标答案向量送入预设序列到序列seq2seq模型中,生成与所述目标词组类型对应的问题题目文本。
优选地,所述将与所述目标词组类型对应的所述目标词向量、所述位置向量、以及所述预设目标答案向量送入预设序列到序列seq2seq模型中,生成与所述目标词组类型对应的问题题目文本的步骤之前,还包括:
从所述预设存储区域中获取与目标词组类型对应的目标样本文本;
对所述目标样本文本进行分词,使得所述目标样本文本具有样本文本词组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010103758.3/2.html,转载请声明来源钻瓜专利网。