[发明专利]一种识别问卷批改得分的方法有效
申请号: | 201711342421.2 | 申请日: | 2017-12-14 |
公开(公告)号: | CN108009537B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 宿玲玲;马亮 | 申请(专利权)人: | 北京慧辰资道资讯股份有限公司;江苏飚众教育科技有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/146;G06V10/82;G06N3/04;G06N3/08;G06V30/16 |
代理公司: | 北京壹川鸣知识产权代理事务所(特殊普通合伙) 11765 | 代理人: | 孙丽朋 |
地址: | 100098 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 问卷 批改 得分 方法 | ||
1.一种识别问卷批改得分的方法,其特征在于,包括以下步骤:
1)设计一种双线识别框,并根据所设计的双线识别框,建立问卷批改得分数据集,其来源包括实际扫描生成的数据集和机器模拟合成的数据集;
2)对上一步建立的数据集做简单数据清洗,剔除不可用数据,对建立的数据集做数据加强,包括对图片进行膨化处理,液化处理,二值化处理,仿射变换,加入随机噪声;数据加强操作可使模型更加适应实际中各学校复印扫描质量的差异,教师批改问卷得分时笔触的差异,教师手写习惯不一的问题;
3)构建提升模型,采用基于深度学习的生成模型解决前期构建模型时,小数量训练集在模型上的过拟合问题,根据小数量的实际样本,利用生成模型生成与实际样本同分布的其他样本共同构成训练集,用于训练模型;同时实际应用中,采集到的实际样本会存在样本的不平衡问题,此时提升模型可用于解决上述问题;
4)构建预测模型,确定所采用模型的基本结构,包括模型的深度,宽度,卷积层,pooling层,batch normalization层,dropout层的堆叠结构,区别于其他模型,首先从数据集中采样小数量数据集,用于模型校验,通过对模型损失,梯度和对小数量数据集的拟合程度,判断模型结构的正确性,之后将数据集分割为训练集和测试集,预测模型对训练集进行训练,采用测试集进行验证,利用交叉验证确定最优化学习率与正则化强度,得到最优化模型;
5)模型应用后根据实际反馈结果得到更多实际样本,反复迭代替换开源数据集中的样本,逐步提升模型预测精度;
其中,步骤1 建立数据集包括:
步骤1.1:基于所设计的双线识别框的模式,首先利用开源的手写体数据集进行合成,得到基于开源数据集的部分数据集;
步骤1.2:基于所设计的双线识别框模式,构建小数量的实际数据集。
2.根据权利要求1所述的识别问卷批改得分的方法,其特征在于,在建立数据集中采用了实际数据和机器模拟数据两种方法,并且采用了包括对图像的膨化处理,液化处理,二值化处理,仿射变换,添加随机噪声的数据加强技术,使得所构建的数据集具有多样性,可解决实际中包括书写位置偏移,书写笔触粗细不一,试卷质量差导致的扫描图像差的问题。
3.根据权利要求1所述的识别问卷批改得分的方法,其特征在于,采用了卷积神经网络对教师批改得分进行识别的方法,传统的基于图像的识别方法基于自定义特征,对应于得分的识别则考虑的是0-9这10个数字的特征,采用卷积神经网络则省去了人工自定义特征的过程,并且深层卷积网络模型识别率高于传统模型。
4.根据权利要求1所述的识别问卷批改得分的方法,其特征在于,采用了基于深度学习的生成网络用于产生部分实验样本,提升模型初始准确率,由于人工构建数据集成本高,而基于深度学习的生成模型则可根据现有数据集利用随机噪声产生与原数据集同分布的图片,利用生成模型生成图片加入到初始的训练集中能够提升初始模型的识别准确率,并且能够在模型运用中解决实际应用中样本不均衡问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慧辰资道资讯股份有限公司;江苏飚众教育科技有限公司,未经北京慧辰资道资讯股份有限公司;江苏飚众教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711342421.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:安装在室外的防雨型电力表箱
- 下一篇:一种高度调节机构