[发明专利]一种智能问题生成方法、装置和计算机可读存储介质有效

专利信息
申请号: 201810068857.5 申请日: 2018-01-24
公开(公告)号: CN108363743B 公开(公告)日: 2020-06-02
发明(设计)人: 韩金新;郑海涛;王伟;陈金元;肖喜 申请(专利权)人: 清华大学深圳研究生院
主分类号: G06F16/31 分类号: G06F16/31;G06F16/36;G06F40/211
代理公司: 深圳新创友知识产权代理有限公司 44223 代理人: 徐罗艳
地址: 518055 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 智能 问题 生成 方法 装置 计算机 可读 存储 介质
【说明书】:

发明公开了智能问题生成方法、装置和计算机可读存储介质,用于对输入的文章自动生成问题并输出,包括以下步骤:S1、利用seq2seq模型对所述文章进行关键内容的提取;S2、对所述关键内容中的每一个句子进行句法分析和命名实体识别,以建立每个句子相应的语法树;S3、利用所述语法树与预先建立的问题模板数据库中的问题模板进行匹配,若存在相匹配的问题模板,则将与所述语法树对应的句子转换为基于所述相匹配的问题模板的疑问句,从而生成问题;S4、对生成的所述问题利用神经网络进行排序后输出。

技术领域

本发明涉及计算机和自然语言处理技术领域,尤其涉及一种基于深度学习的智能问题生成方法和相应的装置。

背景技术

随着计算机网络的蓬勃发展,网络上的信息化数据越来越多,用户不可能将所有的信息阅读完才发现自己的兴趣点。目前对于网络上的文章、文献等的筛选阅读,大多还停留在通过浏览标题来决定是否继续阅读文章,然而这种方法存在的缺陷是:很多标题并不能准确地、全面地反应文章的核心内容,导致用户不能准确地找到感兴趣的文章,又或者,错过感兴趣的文章。因此,我们可以考虑利用自然语言处理的相关技术将文章内容浓缩成几个相关的问题,以问题的形式来吸引用户的阅读兴趣,当文章的问题中正好有用户关心或感兴趣的话题时,就可吸引用户去文章中寻找答案,从而用户阅读的乐趣会大大增加。

目前,利用自然语言处理技术对文章自动生成问题的相关技术主要应用于教育教学领域,例如帮助教师从阅读文献中生成一系列的问题,来测评学生对该文献的理解程度,从而可大大地减轻教师的工作量,让其更多的精力投入于教学。

据目前调研情况,中文语言处理方面尚未出现成熟的技术来解决智能问题生成的问题;已经存在的英文方面的问题生成方法可以归结为三类:基于语义结构的问题生成算法、基于模版的问题生成算法和基于序列的问题生成算法。

基于语义结构的问题生成算法:句子中的语义角色主要包含了实施者、受事者、课题、目标、工具、时间、地点、谓词等语法角色,文本中的每个句子均是由这些成分组成的,通过识别句子中每个单词的角色可以找到句子中单词的相关关系,Kunichika和Mazidi等人正是利用这样的相关关系来生成问题。Kunichika等人利用语法关系对英文故事生成问题,去测试不同人对故事的理解水平,文中从五个角度去生成问题:对整个句子内容提问、利用近义词与反义词的对应进行提问、根据时间与空间的关系进行提问、对句子中存在复数形式的词进行提问和复数相关短语进行提问,但其结果显示这种方式生成的问题存在较多的语法错误。Mazidi等人在语义结构的基础上添加了自然语言理解的内容,其先将文本内容分别进行语法角色标注和语义角色标注,综合两种结果,在问题生成上取得了不错的效果。例如,针对一个句子“小明昨天晚上在公园遇到了小红”,先进行语义角色标注,如下表1:

表1

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810068857.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top