[发明专利]一种作文类文本智能评分方法、系统与设备在审
申请号: | 202111311143.0 | 申请日: | 2021-11-08 |
公开(公告)号: | CN113743091A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 马磊;郭成锋;袁峰;邢金宝;薛勇;赵瑞瑞 | 申请(专利权)人: | 山东山大鸥玛软件股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06N20/00 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘宝 |
地址: | 250101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 作文 文本 智能 评分 方法 系统 设备 | ||
1.一种作文类文本智能评分方法,其特征在于,方法包括:
S1、作文体裁判别模块对输入的作文文本进行体裁判别;
作文体裁判别模型的训练方式为基于预训练语言模型的迁移学习方式,具体实施步骤:
S11,收集大量不同类别的作文语料,对作文的体裁类型进行标注,形成训练数据;
S12,基于预训练语言模型构建作文体裁判别模型,模型包括:语义抽取网络层和分类预测层;
S13,在已标注的作文语料上进行作文体裁判别模型的精调训练;
S2、作文基础等级判别模块依据输入文本的体裁类别,选择预设的判别模型对输入文本进行基础等级判别;
步骤S2中,作文基础等级判别模型的训练方式为基于预训练语言模型的渐进式迁移学习方式,具体实施步骤:
S21,收集同一体裁已标注的作文数据,将分值映射到A,B,C和D四个基础等级类别上,结合作文的题目要求共同形成训练数据;
每条作文数据的形式为:作文题目要求的文本以及考生的作文文本;
除真实数据外,通过将不匹配的作文题目要求和作文文本结合的方式构造一部分类别为D类别的伪数据;
S22,基于预训练语言模型构建作文基础等级判别基础模型,模型包括:语义抽取网络层和分类预测层;
S23,在大量已标注的作文数据集上进行精调训练,训练时对全部语义抽取网络层和分类预测层的权重进行更新,训练完成的模型为作文基础等级判别领域模型;
S24,在特定的考试测评任务中,收集预设数量专家定标的作文数据,在作文基础等级判别领域模型的基础之上再一次进行模型精调训练,训练时保持语义抽取网络层的权重不变,对分类预测层的权重进行更新,精调完成的模型为作文基础等级判别任务模型;
S3、浮动分值判别模块依据预设评分规则进行加分或扣分;
S4、合分模块基于合并基础等级分值和浮动分值形成输入作文文本的最终分。
2.根据权利要求1所述的作文类文本智能评分方法,其特征在于,
作文体裁的类型为议论文、散文、说明文、记叙文和应用文。
3.根据权利要求1所述的作文类文本智能评分方法,其特征在于,
作文基础等级所代表的分值根据考试的评分细则设置。
4.根据权利要求1所述的作文类文本智能评分方法,其特征在于,步骤S3中浮动分值判别模块提供以下内容的判别:
S31,统计词汇丰富度,对每一篇待评分作文文本进行分词并去掉停用词,然后统计词汇量,并除以题目要求最低字数进行归一化,对所有待评分作文的相对词汇丰富度进行降序排序,前N名待评分作文的相对词汇丰富度定为A级别,后M名待评分作文的相对词汇丰富度定为C级别,中间待评分作文的相对词汇丰富度定为B级别,每个级别代表的分值以及每个级别的人数比例则根据具体考试设置;
S32,检测篇章顺畅度,篇章顺畅度的检测包括字、词错误统计和语言表达顺畅检测,对于字、词错误统计每出现一个错误点所扣分值以及最大可扣分值根据具体考试的评分细则设置;对于语言表达流畅度则分为A、B和C三个等级,每个级别代表的分值则根据具体考试设置;
S33,统计字数,字数不足时的扣分规则根据具体考试的评分细则设置;
S34,检查题目,题目缺失时的扣分规则根据具体考试的评分细则设置。
5.根据权利要求4所述的作文类文本智能评分方法,其特征在于,
构建篇章顺畅度检测模型,构建的建篇章顺畅度检测模型包括:语义抽取网络层、条件随机场层和顺畅度分类层。
6.根据权利要求1所述的作文类文本智能评分方法,其特征在于,
合并基础等级分值和浮动分值得到输入作文文本的最终分;
最终分最低不低于本等级最低分数,最高不高于本等级最高分数;
通过下述计算式来计算最终分:
上式中表示最终分,MAX函数表示取两者较大,MIN函数表示取两者较小,BL表示某等级最低分数,BU表示某等级最高分数,B表示某等级的基础分值,F表示浮动分值,浮动分值可为负值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东山大鸥玛软件股份有限公司,未经山东山大鸥玛软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111311143.0/1.html,转载请声明来源钻瓜专利网。