[发明专利]基于笔画和自注意力机制的神经网络中文问题生成系统有效
申请号: | 201910572796.0 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110334196B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 黎伟;康琦 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06F40/242;G06N3/088 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 笔画 注意力 机制 神经网络 中文 问题 生成 系统 | ||
本发明提供一种基于笔画和自注意力机制的神经网络中文问题生成系统,用于根据被获取的中文段落生成相应的中文问题,其特征在于,包括:笔画词向量存储部,用于存储预先训练得到的笔画词向量,中文段落获取部,用于获取中文段落,提示词提取部,用于根据从中文段落中提取多个关键词作为至少一个提示词,词向量转换组合部,用于将中文段落转换为中文词向量、将提示词转换为掩码形式的提示词掩码、并将中文词向量以及提示词掩码与笔画词向量连接形成组合向量,问题词生成部,用于根据组合向量生成多个问题词,中文问题组合输出部,用于将问题词依序组合为中文问题并进行输出。
技术领域
本发明属于人工智能领域,涉及一种基于笔画和自注意力机制的神经网络中文问题生成系统。
背景技术
学习提问在人类智能的发展和人工智能系统的发展中都起着重要作用。在许多应用领域中,对问题产生的需求正在迅速增长。问题生成系统旨在根据给定的文章生成各种问题,可以提供根据文章,生成问题作为教育材料来指导学生学习,可以改进问答系统的准确率,还可以帮助聊天机器人冷启动或继续与人交谈。
现有的中文问题生成效果不佳,目前最常用基于规则的系统将陈述句转换为问题,这一种方法需要大量的人力创建规则,现有的基于规则的中文问题生成系统只能生成固定形式的问题,且需要大量的人力支持。由于系统规则中的错误以及一些其他不可避免的错误,这些模型表现不佳。
现有技术基于规则的中文问题生成,或直接使用英文问题生成系统,将带来以下几个问题:第一,若采用基于规则的中文问题生成,需要大量的人力创建规则,生成的问题也具有固定形式,并且无法避免规则中的错误;第二,没有很好利用中文语义与字形相关这一特征,导致中文问题生成系统效果差;第三,直接使用英文问题生成系统,不能解决汉语中经常出现的未登录词(Out Of Vocabulary,OOV)问题。
现列举三种相关技术及其缺点:
相关技术1:专利“一种基于答案与答案位置信息的神经网络问题生成方法”,申请号201811587178.5。该发明专利涉及一种基于拷贝机制的序列到序列模型,基于答案与答案位置信息,问题句生成过程分为三个模式,问题词生成模式,词典词生成模式和拷贝模式。
缺点:该专利是基于英文段落生成英文问题,由于中文中未登录词的数量很多,在生成的问题中无法表示,导致这种方法不能直接应用于中文问题生成。
相关技术2:专利“一种中文相似问题生成系统与方法”,申请号201811360413.5。该发明专利涉及一种中文相似问题生成系统,该系统可以根据相似度在手动标记的语义知识库中定位相应的关键词,通过关键词在语义知识库的关联度和相似度排序输出相似问题。
缺点:该专利需要事先构建语义知识库,这一过程需要大量的人力;而且语义知识库的质量会在很大程度上影响系统的表现,如果语义知识库有错误的话,在问题生成部分会出现不可避免的错误,并且该方法生成的问题质量较差。
相关技术3:专利“一种基于生成式对抗网络的开放式问题自动生成方法”,申请号201811495625。该发明专利涉及一种基于生成式对抗网络的开放式问题自动生成方法,在开放式问题生成上,建立问题自动生成模型包括生成器和鉴别器,采用增强学习的模型对抗训练方法,实现问题自动生成。
缺点:该专利主要针对开放式问题生成,评价标准为是否符合人类提问的语言风格,其针对封闭式问题的生成质量较差,不能很好生成有关某段文本的问题。
发明内容
为解决上述问题,提供一种基于笔画和自注意力机制的神经网络中文问题生成系统,本发明采用了如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910572796.0/2.html,转载请声明来源钻瓜专利网。