[发明专利]模型训练方法、判题方法及装置、设备、存储介质有效
| 申请号: | 202011036869.3 | 申请日: | 2020-09-28 |
| 公开(公告)号: | CN111882004B | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 刘军;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06T3/60;G06K9/32 |
| 代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 包莉莉;武晨燕 |
| 地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 设备 存储 介质 | ||
本申请提出一种模型训练方法、判题方法及装置、设备、存储介质;其中,该方法包括:获取第一训练数据,第一训练数据包括第一初始文本图像及对应的第一旋转文本图像;构建第一初始模型,第一初始模型中包括未训练的编码器和反卷积层;根据第一训练数据训练第一初始模型,得到第一图像旋转校正模型;构建第二初始模型,第二初始模型中包括第一图像旋转校正模型中的编码器;根据第一训练数据训练第二初始模型,得到文本行检测模型,文本行检测模型用于检测出第一待处理文本图像中的文本行所在的位置。这样可以有效改善或解决判题过程中的拍照图像旋转问题,并可以提升模型训练效率,提高判题准确性。
技术领域
本申请涉及一种数据处理技术,尤其涉及一种模型训练方法、判题方法及装置、设备、存储介质。
背景技术
拍照判题是人工智能技术在教育领域的一项重要应用。通常情况下拍照判题的流程可包括:用手机或平板电脑等终端设备对待判题图像拍照,然后将待判题图像上传至拍照判题的应用程序。应用程序对待判题图像进行多个环节的处理,然后将判题结果输出。
如果用户上传图片的时候不是正面拍摄,而是倾斜拍摄,如将答题图像旋转90度或者直接翻转拍摄,这种情况下,将影响判题结果,导致非常差的用户体验。
发明内容
本申请实施例提供一种模型训练方法、判题方法及装置、设备、存储介质,以解决相关技术存在的问题,技术方案如下:
第一方面,本申请实施例提供了一种文本行检测模型的训练方法,包括:
获取第一训练数据,所述第一训练数据包括第一初始文本图像及对应的第一旋转文本图像;
构建第一初始模型,所述第一初始模型中包括未训练的编码器和反卷积层;
根据所述第一训练数据训练所述第一初始模型,得到第一图像旋转校正模型;
构建第二初始模型,所述第二初始模型中包括所述第一图像旋转校正模型中的编码器;
根据所述第一训练数据训练所述第二初始模型,得到文本行检测模型,所述文本行检测模型用于检测出第一待处理文本图像中的文本行所在的位置。
第二方面,本申请实施例提供一种文本行检测方法,包括:
获取第一待处理文本图像;
根据所述文本行检测模型检测出所述第一待处理文本图像中的文本行所在的位置,其中,所述文本行检测模型是上述训练方法所得到的。
第三方面,本申请实施例提供一种文本识别模型的训练方法,包括:
获取第二训练数据,所述第二训练数据包括第二初始文本图像及对应的第二旋转文本图像;
构建第三初始模型,所述第三初始模型中包括编码器和反卷积层;
根据所述第二训练数据训练所述第三初始模型,得到第二图像旋转校正模型;
构建第四初始模型,所述第四初始模型中包括所述第二图像旋转校正模型中的编码器;
根据所述第二训练数据训练所述第四初始模型,得到文本识别模型,所述文本识别模型用于从第二待处理文本图像中得到文本识别结果。
第四方面,本申请实施例提供一种文本识别方法,包括:
获取第二待处理文本图像;
基于文本识别模型从所述第二待处理文本图像中得到文本识别结果,其中,所述文本识别模型是根据上述的训练方法所得到的。
第五方面,本申请实施例提供一种判题方法,包括:
获取待判题图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011036869.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢帘线的应力检测装置
- 下一篇:一种固体火箭发动机装药表征方法





