[发明专利]一种智能问题生成方法、装置和计算机可读存储介质有效
| 申请号: | 201810068857.5 | 申请日: | 2018-01-24 |
| 公开(公告)号: | CN108363743B | 公开(公告)日: | 2020-06-02 |
| 发明(设计)人: | 韩金新;郑海涛;王伟;陈金元;肖喜 | 申请(专利权)人: | 清华大学深圳研究生院 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/36;G06F40/211 |
| 代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 徐罗艳 |
| 地址: | 518055 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 智能 问题 生成 方法 装置 计算机 可读 存储 介质 | ||
1.一种智能问题生成方法,用于对输入的文章自动生成问题并输出,其特征在于,包括以下步骤:
S1、利用seq2seq模型对所述文章进行关键内容的提取;
S2、对所述关键内容中的每个句子进行句法分析和命名实体识别,以建立每个句子相应的语法树;
S3、利用所述语法树与预先建立的问题模板数据库中的问题模板进行匹配,若存在相匹配的问题模板,则将与所述语法树对应的句子转换为基于所述相匹配的问题模板的疑问句,从而生成问题;当所述句子的所述语法树与所述问题模板数据库中的所有问题模板均不匹配时,则所述句子不能生成问题;对不能生成问题的句子进行统计,以制定新的问题模板并更新所述问题模板数据库;
S4、对生成的所述问题,利用基于神经网络架构的问题排序模型进行自动打分并按分数高低排序输出。
2.如权利要求1所述的智能问题生成方法,其特征在于:所述seq2seq模型是经过以下训练而得到的:
对多篇用于训练的文章进行关键内容的人工提取,并将每一篇训练文章及其人工提取的关键内容组成一个训练样本,以建立seq2seq模型的训练集;将训练集输入到seq2seq模型中,进行不断的迭代训练直至模型参数收敛,得到训练好的seq2seq模型。
3.如权利要求2所述的智能问题生成方法,其特征在于:所述seq2seq模型还具有注意力机制,用于在步骤S1中进行所述关键内容提取时,对预先建立的固定词表中未出现过的词,直接生成或直接复制到输出结果中作为所述关键内容的一部分,提高所生成句子的可读性。
4.如权利要求1所述的智能问题生成方法,其特征在于:通过从文章数据中,学习语言规则而建立起所述问题模板数据库;当所述句子的所述语法树与所述问题模板数据库中的某一问题模板相匹配时,利用所述某一问题模板将所述句子直接转化为疑问句,生成相应的问题。
5.如权利要求1所述的智能问题生成方法,其特征在于:问题排序模型的训练包括:
对从多篇文章中生成的多个用于训练的问题,分别进行人工打分;对每一用于训练的问题,进行特征提取得到特征集合,并将每一特征集合及其对应问题的人工打分组成一个训练样本,得到多个训练样本,组成所述问题排序模型的训练集;利用所述训练集训练神经网络模型,通过进行不断的迭代训练直至模型参数收敛,得到训练好的问题排序模型。
6.如权利要求5所述的智能问题生成方法,其特征在于:在对所述用于训练的问题进行所述人工打分时,从问题是否符合语言逻辑以及问题的价值度高低两方面来综合打分。
7.一种智能问题生成装置,用于对输入的文章自动生成问题并输出,其特征在于,包括:
seq2seq模型,用于对所述文章进行关键内容的提取;
语法树构建程序,用于对所述关键内容中的每一个句子进行句法分析和命名实体识别,以建立每个句子相应的语法树;
问题构建程序,利用所述语法树与预先建立的问题模板数据库中的问题模板进行匹配,并在存在相匹配的问题模板时,将与所述语法树对应的句子转换为基于所述相匹配的问题模板的疑问句,以生成问题;以及,在不存在相匹配的问题模板时,不将对应于该语法树的句子生成问题,并通过批量统计不能生成问题的句子,制定新的问题模板,更新到所述问题模板数据库;
基于神经网络架构的问题排序模型,用于对生成的问题进行自动打分并按分数高低排序输出。
8.如权利要求7所述的智能问题生成装置,其特征在于:所述seq2seq模型还具有注意力机制,用于在进行所述关键内容提取时,对预先建立的固定词表中未出现过的词,直接生成或直接复制到输出结果中作为所述关键内容的一部分。
9.如权利要求7所述的智能问题生成装置,其特征在于:所述问题排序模型是一预先训练好的神经网络模型;其中,对该神经网络模型进行训练时所采用的训练集中包含多个训练样本,每个训练样本由用于训练的问题的特征集及其人工打分所组成。
10.一种计算机可读存储介质,其上存储有一计算机程序,其特征在于:所述计算机程序被处理器执行时可实现权利要求1至6任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810068857.5/1.html,转载请声明来源钻瓜专利网。





