[发明专利]文本检测模型的训练方法、装置、可读存储介质及设备有效
申请号: | 202110255729.3 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112686218B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 王德强;刘霄;熊泽法 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 顾可嘉;夏华栋 |
地址: | 100872 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 模型 训练 方法 装置 可读 存储 介质 设备 | ||
1.一种文本检测模型的训练方法,其特征在于,包括:
将待处理样本图像输入卷积网络模型,得到预测值;所述预测值为样本图像的预测置信度;
获取所述样本图像的标注值;
根据所述标注值、所述预测值以及损失函数得到预测损失;以及
根据所述预测损失调整所述卷积网络模型的参数;
其中,所述损失函数包括简单样本判定函数和权重系数函数;
所述简单样本判定函数用于过滤所述预测置信度大于预设第一阈值的样本图像,以及过滤所述预测置信度小于预设第二阈值的样本图像,所述权重系数函数用于调节未被过滤样本图像的权重。
2.根据权利要求1所述的文本检测模型的训练方法,其特征在于,所述权重系数函数用于动态自适应调节未被过滤样本图像的权重。
3.根据权利要求2所述的文本检测模型的训练方法,其特征在于,所述权重系数函数基于指数形式的权重调节因子以及所述预测值,动态自适应调节未被过滤样本图像的权重。
4.根据权利要求1所述的文本检测模型的训练方法,其特征在于,所述权重系数函数的取值限制在预设范围内。
5.根据权利要求1所述的文本检测模型的训练方法,其特征在于,所述损失函数采用如下公式:
,;
,;
其中,表示所述损失函数;表示所述标注值,表示所述标注值为正样本,表示所述标注值为负样本;表示所述预测值;
函数表示针对正样本的简单样本判定函数,为所述第一阈值,;
函数表示针对负样本的简单样本判定函数,为所述第二阈值,;
函数表示针对正样本的权重系数函数;
函数表示针对负样本的权重系数函数;
[,]表示所述权重系数函数的取值范围。
6.根据权利要求4或5所述的文本检测模型的训练方法,其特征在于,所述权重系数函数的取值范围为1~5。
7.根据权利要求5所述的文本检测模型的训练方法,其特征在于,函数的值随着所述预测值的增大而减小;函数的值随着所述预测值的增大而增大。
8.根据权利要求5所述的文本检测模型的训练方法,其特征在于,所述第一阈值与所述第二阈值满足如下关系:。
9.根据权利要求5或8所述的文本检测模型的训练方法,其特征在于,所述第一阈值的取值范围为0.90~0.99;所述第二阈值的取值范围为0.15~0.25。
10.根据权利要求1所述的文本检测模型的训练方法,其特征在于,所述损失函数采用如下公式:
其中,表示所述损失函数;表示所述标注值,表示所述标注值为正样本,表示所述标注值为负样本;表示所述预测值;
表示简单样本判定函数;
表示针对正样本的简单样本判定函数,为所述第一阈值,;
表示针对负样本的简单样本判定函数,为所述第二阈值,;
表示针对正样本的权重系数函数;
表示针对负样本的权重系数函数。
11.根据权利要求10所述的文本检测模型的训练方法,其特征在于,的取值范围为1.5~5.0。
12.根据权利要求10所述的文本检测模型的训练方法,其特征在于,所述第二阈值小于所述第一阈值。
13.根据权利要求12所述的文本检测模型的训练方法,其特征在于,所述第一阈值的取值范围为0.90~0.99;所述第二阈值的取值范围为0.75~0.85。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110255729.3/1.html,转载请声明来源钻瓜专利网。