[发明专利]基于作文论据特征分类器的语言生成模型及写作支持方法在审

专利信息
申请号: 202011023526.3 申请日: 2020-09-25
公开(公告)号: CN112182210A 公开(公告)日: 2021-01-05
发明(设计)人: 高震;蒋天惠;曹希燕;肖聪;阎华 申请(专利权)人: 四川华空天行科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/205
代理公司: 北京天奇智新知识产权代理有限公司 11340 代理人: 叶明博
地址: 610213 四川省成都市*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 作文 论据 特征 分类 语言 生成 模型 写作 支持 方法
【说明书】:

本发明涉及一种基于作文论据特征分类器的语言生成模型及写作支持方法,它包括语言模型训练步骤和用户写作步骤;所述用户写作步骤包括寻求论据支持写作步骤和/或寻求开放性写作步骤。本发明的优点在于:提高了语言生成模型的稳定性,生成的提示内容词句通顺达意,并与作者的论点相关度有大幅度提高(60%),为用户提供传统方法无法达到的强一致性论据提示模型和文章续写模型;可以为广大学生提供低成本、高效、实时且精准的写作指导。尤其是对于英语等外语写作学习,将为学生提供接近母语的写作建议、帮助学生尽快跨过初级写作门槛、让学生能依照自己观点顺利完成作文。

技术领域

本发明涉及主题分析技术领域,尤其涉及基于作文论据特征分类器的语言生成模型及写作支持方法。

背景技术

传统机器学习和自然语言处理界的摘要模型和语言生成模型直接应用在教育领域的议论文写作的效果不理想;首先传统的写作批改建议模型在评分标准总结阶段不区分支持论据和反对论据,导致在评语建议阶段提出的论据,可能会和作者的论点相冲突。而最近几年的支持预训练的深度学习语言模型(比如GPT-2)对于议论文写作提示方面不具有足够的语境信息,不能生成高质量的跟作文题目相关的内容。即使该语言生成模型经过了微调训练而具备了一定的语境信息,但是该语言环境信息并不区分是正方观点还是反方观点,从而使生成的建议内容混杂了正方观点和反方观点,导致语言模型的生成内容不可用或者效率低下,使得GPT-2在该领域的大范围应用受到了阻碍。

申请号为201711160875.8公布的一种级联式作文生成方法的专利中存在句子间逻辑无法连贯,不能保证生成的作文能够符合主题的问题;而申请号为201811202083.7公布的一种基于主题模型的HSK作文生成方法的专利中仍然采用基于低效的关键词搜索句子的方法,无法产生新的句子,且所需样本量大,句子件逻辑性查,观点一致性差;申请号为201710322347.1公布的一种基于模板的自动生成作文的系统及实现方法的专利中则存在生成的作文范围窄,生成文本单调,词句连贯性逻辑性差的问题。

发明内容

本发明的目的在于克服现有技术的缺点,提供了一种基于作文论据特征分类器的语言生成模型及写作方法,解决了现有作文写作方法不区分支持论据和反对论据,导致在评语建议阶段提出的论据,或者语言提示的内容经常会和作者的论点相冲突的问题。

本发明的目的通过以下技术方案来实现:一种基于作文论据特征分类器的语言生成模型,它包括以下内容:

根据TextRank算法对作文库中输入的大量高分作文进行作文论据评分,输出基于论据的评分标准并对评分标准进行预分类得到支持论据集合和反对论据集合;

对所有作文的摘要进行总结并将当前作文的总结和评分标准进行对比后得到作文库中全部作文的特征向量表;

根据支持论据集合和反对论据集合与作文库的特征向量表对每一篇作文进行打分,得到正方观点作文集合和反方观点作文集合;

将正方观点作文集合和反方观点作文集合作为输入并根据评分标准分别生成正方论据模型和反方论据模型,并对各作文库进行微调训练得到GPT-2语言生成模型。

进一步地,所述根据TextRank算法对作文库中输入的大量高分作文进行作文论据评分,输出基于论据的评分标准并对评分标准进行预分类得到支持论据和反对论据集合包括:

通过TextRank算法对作文库中每一篇作为做摘要之后将高分作文的摘要集合起来,删除冗余论据,整合成一个包含支持论据和反对论据的论据集合,即评分标准,并将其输出;

采用VaderSentiment方法对每一个论据句子给出一个支持性评分,并根据评分结果得到支持论据集合和反对论据集合。

进一步地,所述对所有作文的摘要进行总结包括:

根据TextRank算法将作文文章中的句子看作图中的点,把句子之间的相似度看作图中的边;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川华空天行科技有限公司,未经四川华空天行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011023526.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top