[发明专利]基于深度学习的广告文字的识别方法、系统、介质及设备有效
申请号: | 201911250460.9 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111062388B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 成丹妮;罗超;胡泓 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/19;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 广告 文字 识别 方法 系统 介质 设备 | ||
1.一种基于深度学习的广告文字的识别方法,其特征在于,所述识别方法包括:
获取多个文字块,所述文字块包括后期添加文字块以及原始场景文字块;
其中,所述文字块为含有文字的图像,所述后期添加文字块包括后期添加文字,所述原始场景文字块仅包括原始场景文字,所述后期添加文字为在图片生成之后通过后期文字处理手段在所述图片上添加的文字,所述原始场景文字为在拍摄时或视频帧截取时包含的文字;
以所述后期添加文字块为正样本,以所述原始场景文字块为负样本训练第一深度学习模型;
将含有文字的待检测图像输入训练后的所述第一深度学习模型,以识别所述待检测图像中的文字类别,所述文字类别包括所述后期添加文字以及所述原始场景文字;
对含有所述后期添加文字的待检测图像进行广告文字识别;
所述获取多个文字块的步骤包括:
获取经人工标记的含有文字的图像;
识别所述图像中的所述文字块的中心点以及所述文字块的尺寸;
以所述中心点为中心,从所述图像中裁切得到与所述文字块的尺寸具有不同尺寸比例关系的多个关联文字块。
2.如权利要求1所述的基于深度学习的广告文字的识别方法,其特征在于,
所述获取多个文字块的步骤之前包括:以人工标记的含有文字的图像训练第二深度学习模型,所述第二深度模型用于识别图像中是否含有文字;
所述将含有文字的待检测图像输入训练后的所述第一深度学习模型,以识别所述待检测图像中的文字类别的步骤之前包括:将待检测图像输入训练后的第二深度学习模型,以识别所述待检测图像是否含有文字;若是,则执行所述将含有文字的待检测图像输入训练后的所述第一深度学习模型的步骤。
3.如权利要求1或2所述的基于深度学习的广告文字的识别方法,其特征在于,所述对含有所述后期添加文字的待检测图像进行广告文字识别的步骤包括:
判断所述后期添加文字是否与预设的广告关键词匹配;
若是,则确认所述后期添加文字为广告文字,并过滤所述待检测图像;
若否,则确认所述后期添加文字为非广告文字,并将所述待检测图像展示给用户;
和/或,
所述第一深度学习模型为卷积神经网络模型。
4.一种基于深度学习的广告文字的识别系统,其特征在于,所述识别系统包括:
文字块获取模块,用于获取多个文字块,所述文字块包括后期添加文字块以及原始场景文字块;
其中,所述文字块为含有文字的图像,所述后期添加文字块包括后期添加文字,所述原始场景文字块仅包括原始场景文字,所述后期添加文字为在图片生成之后通过后期文字处理手段在所述图片上添加的文字,所述原始场景文字为在拍摄时或视频帧截取时包含的文字;
第一训练模块,用于以所述后期添加文字块为正样本,以所述原始场景文字块为负样本训练第一深度学习模型;
类型识别模块,用于将含有文字的待检测图像输入训练后的所述第一深度学习模型,以识别所述待检测图像中的文字类别,所述文字类别包括所述后期添加文字以及所述原始场景文字;
广告识别模块,用于对含有所述后期添加文字的待检测图像进行广告文字识别;
所述文字块获取模块用于获取经人工标记的含有文字的图像;识别所述图像中的所述文字块的中心点以及所述文字块的尺寸;以所述中心点为中心,从所述图像中裁切得到与所述文字块的尺寸具有不同尺寸比例关系的多个关联文字块。
5.如权利要求4所述的基于深度学习的广告文字的识别系统,其特征在于,
所述识别系统还包括第二训练模块,所述第二训练模块用于以人工标记的含有文字的图像训练第二深度学习模型,所述第二深度模型用于识别图像中是否含有文字;
所述识别系统还包括文字识别模块,所述文字识别模块用于将待检测图像输入训练后的第二深度学习模型,以识别所述待检测图像是否含有文字;若是,则调用所述类型识别模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911250460.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:担保圈识别方法及装置
- 下一篇:一种多角度移动式玻璃起吊装置