[发明专利]基于特征学习的短答案自动评分方法、系统及存储介质有效
申请号: | 201811355345.3 | 申请日: | 2018-11-14 |
公开(公告)号: | CN109670168B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 朱佳;伦家琪;肖菁;余伟浩 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/35;G06N3/0464;G06N3/0442;G06N3/045;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510631 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 学习 答案 自动 评分 方法 系统 存储 介质 | ||
本发明公开了基于特征学习的短答案自动评分方法、系统及存储介质,方法包括:对短答案的问题、标准答案以及回答答案进行分词操作,生成词序列;对词序列进行向量化表示,生成映射矩阵;对映射矩阵进行词语级别的特征抽取,生成词语特征;对映射矩阵进行句子级别的特征抽取,生成句子特征;根据词语特征和句子特征,通过深度学习分类器模型预测短答案的文本类别;基于文本类别与分值的映射关系,确定短答案的分数。本发明无需进行人工处理,大大提高了工作效率,同时参考了词语因素和句子因素,提高了分类准确率,进而提高了评分的准确率,可广泛应用于深度学习技术领域。
技术领域
本发明涉及深度学习技术领域,尤其是基于特征学习的短答案自动评分方法、系统及存储介质。
背景技术
近年来,教育界的自动短答案评分技术吸引了大量学者的研究兴趣,该技术旨在自动评估自然语言的短答案。然而,简短的答案一般仅由几个单词或几个句子组成,只包含很少的有用信息。传统的短答案评分技术严重依赖于特征工程来评估来分配短答案的分数,这需要大量的劳动力来手工设计最有价值的特征,并且在大多数情况下需要专家的知识,评分效率较低;另外,传统的短答案评分方法将评分过程视为一个分类任务,直接将学生的答案与给定问题的标准答案进行相似度匹配,得到答案对应的分数类别,进而计算得到最终得分,这种方法的准确率较低。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种效率高且准确率高的,基于特征学习的短答案自动评分方法、系统及存储介质。
本发明一方面所采取的技术方案为:
基于特征学习的短答案自动评分方法,包括以下步骤:
对短答案的问题、标准答案以及回答答案进行分词操作,生成词序列;
对词序列进行向量化表示,生成映射矩阵;
对映射矩阵进行词语级别的特征抽取,生成词语特征;
对映射矩阵进行句子级别的特征抽取,生成句子特征;
根据词语特征和句子特征,通过深度学习分类器模型预测短答案的文本类别;
基于文本类别与分值的映射关系,确定短答案的分数。
进一步,所述对词序列进行向量化表示,生成映射矩阵这一步骤,包括以下步骤:
通过文本分类器训练词语库;
根据训练好的词语库,对词序列中的每个词语进行多维向量化表示,生成映射矩阵。
进一步,所述对映射矩阵进行词语级别的特征抽取,生成词语特征这一步骤,包括以下步骤:
对映射矩阵进行词语重叠特征提取;
对映射矩阵进行问题类型特征提取,生成问题类型集合;
根据映射矩阵,生成回答答案和标准答案之间的相似词性标记;
对词语重叠特征、问题类型集合和相似词性标记进行结合,生成词语特征。
进一步,所述对映射矩阵进行句子级别的特征抽取,生成句子特征这一步骤,包括以下步骤:
对映射矩阵进行句子级别的特征抽取,分别得到短答案的问题的语义特征向量、标准答案的语义特征向量和回答答案的语义特征向量;
对短答案的问题的语义特征向量、标准答案的语义特征向量和回答答案的语义特征向量进行向量运算特征转换,生成句子特征。
进一步,所述对映射矩阵进行句子级别的特征抽取,得到标准答案的语义特征向量这一步骤,其具体为:
通过Bi-LSTM神经网络对标准答案的映射矩阵进行运算,生成标准答案的语义特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811355345.3/2.html,转载请声明来源钻瓜专利网。