[发明专利]模型训练、文本识别方法及装置、电子设备、存储介质有效
申请号: | 202011120169.2 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112016315B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 李盼盼;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 文本 识别 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供一种模型训练方法及装置、文本识别方法及装置、电子设备、存储介质,应用于人工智能技术领域,模型训练方法包括:获取多个包含弯曲文本的第一样本图像及第一样本图像中的弯曲文本的文本信息;分别将第一样本图像输入图像矫正模型及文本识别模型,通过图像矫正模型对第一样本图像进行特征提取,获得第一图像特征;通过文本识别模型对第一样本图像进行特征提取,获得第二图像特征;使用预设的特征损失函数,根据第一图像特征和第二图像特征,确定特征损失值;在通过第一样本图像及第一样本图像中的文本信息对预先训练完成的文本识别模型进行训练时,基于特征损失值对文本识别模型进行更新。本申请可以提高文本识别的准确性。
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种模型训练、文本识别方法及装置、电子设备、存储介质。
背景技术
自然场景文字识别是从包含文字的图像中识别出字符序列的过程,对于中文,一个汉字为一个字符;对于英文,一个字母为一个字符。在自然场景文字识别中,由于图像背景复杂、分辨率低下、字体多样、分布随意等,并且,文字由数量不固定的字符组成,需要从图像中识别长度不固定的序列,因此,自然场景文字识别是一个具有挑战性的任务。
相关技术中,可以通过CRNN(Convolutional Recurrent Neural Networks,卷积循环神经网络)识别图像中的文本信息。由于比CRNN速度快的算法,精度比CRNN低,比CRNN精度高的算法,速度比CRNN低,因此,CRNN是一个性价比很高的算法。但是,针对包含弯曲文本的图像,文本识别的准确性较低。
发明内容
有鉴于此,本申请实施例提供了一种文本识别模型训练方法、文本识别方法、文本识别模型训练装置、文本识别装置、电子设备及存储介质,用以克服现有技术中在对包含弯曲文本的图像进行文本识别时,准确性较低的缺陷。
根据本申请实施例的第一方面,提供了一种文本识别模型训练方法,包括:
获取多个包含弯曲文本的第一样本图像及所述第一样本图像中的弯曲文本的文本信息;
分别将所述第一样本图像输入预先训练完成的图像矫正模型及文本识别模型,其中,所述图像矫正模型用于将包含弯曲文本的图像矫正为包含非弯曲文本的图像,所述文本识别模型用于识别图像中的文本信息;
通过所述图像矫正模型对所述第一样本图像进行特征提取,获得第一图像特征;并且,通过所述文本识别模型对所述第一样本图像进行特征提取,获得第二图像特征;
使用预设的特征损失函数,根据所述第一图像特征和所述第二图像特征,确定特征损失值;
在通过所述第一样本图像及所述第一样本图像中的文本信息对预先训练完成的所述文本识别模型进行训练时,基于所述特征损失值对所述文本识别模型进行更新。
根据本申请实施例的第二方面,提供了一种文本识别方法,包括:
获取待识别的文本图像;其中,所述文本图像包括:包含弯曲文本的图像;
通过文本识别模型对所述文本图像进行文本识别,得到文本信息;
其中,所述文本识别模型基于如第一方面所述的文本识别模型训练方法训练得到。
根据本申请实施例的第三方面,提供了一种文本识别模型训练装置,包括:
第一获取模块,用于获取多个包含弯曲文本的第一样本图像及所述第一样本图像中的弯曲文本的文本信息;
图像输入模块,用于分别将所述第一样本图像输入预先训练完成的图像矫正模型及文本识别模型,其中,所述图像矫正模型用于将包含弯曲文本的图像矫正为包含非弯曲文本的图像,所述文本识别模型用于识别图像中的文本信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011120169.2/2.html,转载请声明来源钻瓜专利网。