[发明专利]文本识别方法和电子设备有效
申请号: | 202210982026.5 | 申请日: | 2022-08-16 |
公开(公告)号: | CN115063800B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 王章成;赵德丽;吕逸良;赵永飞;马傲 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06V30/10 | 分类号: | G06V30/10;G06V30/18;G06V30/19;G06V20/40 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 李静茹 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 电子设备 | ||
1.一种文本识别方法,其特征在于,包括:
获取待识别的视频,其中,所述待识别的视频中至少存在一帧图像包含有待识别的文本;
对所述待识别的视频进行采样,得到目标图像,其中,所述目标图像为所述视频中包含了所述待识别的文本的图像;
对所述目标图像的第一原始信息进行数据增强,得到所述目标图像的第一附加信息,其中,所述第一原始信息至少包括:所述目标图像的三原色信息,所述第一附加信息包括如下至少之一:所述目标图像的色相信息、饱和度信息、明度信息和边缘信息;
基于所述第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述待识别的文本的目标识别结果;
其中,基于所述第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述待识别的文本的目标识别结果,包括:
利用文本识别模型基于第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述目标识别结果,其中,所述文本识别模型的损失函数是基于目标权重、训练文本和识别文本确定的,所述目标权重是基于所述训练文本的类别进行确定的;
其中,所述方法还包括:
确定训练样本中不同类别的训练文本的出现次数,并基于所述出现次数确定频次权重;
确定训练样本中所述不同类别的训练文本的复杂程度,并基于所述复杂程度,确定复杂度权重;
确定所述训练文本和所述识别文本的相似度,并基于所述相似度确定相似度权重;
基于所述频次权重、所述复杂度权重和/或所述相似度权重,确定所述目标权重。
2.根据权利要求1所述的方法,其特征在于,对所述目标图像的第一原始信息进行数据增强,得到所述目标图像的第一附加信息包括如下至少之一:
对所述第一原始信息进行空间转换,得到所述色相信息;
对所述第一原始信息进行空间转换,得到所述饱和度信息;
对所述第一原始信息进行空间转换,得到所述明度信息;
对所述目标图像进行边缘检测,得到所述边缘信息。
3.根据权利要求1所述的方法,其特征在于,所述训练文本是训练样本中包含的文本,所述识别文本是利用所述文本识别模型基于所述训练样本的第二原始信息和第二附加信息对所述训练样本进行文本识别得到的文本,所述第二原始信息包括:所述训练样本的三原色信息,所述第二附加信息包括如下至少之一:所述训练样本的色相信息、饱和度信息、明度信息和边缘信息。
4.根据权利要求1所述的方法,其特征在于,在基于所述第一原始信息和所述第一附加信息对所述目标图像进行文本识别,得到所述待识别的文本的目标识别结果之后,所述方法包括:
基于所述目标识别结果对所述待识别的视频进行检测,得到所述待识别的视频的检测结果,其中,所述检测结果用于表征所述待识别的视频是否满足预设条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210982026.5/1.html,转载请声明来源钻瓜专利网。