[发明专利]基于深度学习的广告文字的识别方法、系统、介质及设备有效

专利信息
申请号: 201911250460.9 申请日: 2019-12-09
公开(公告)号: CN111062388B 公开(公告)日: 2023-05-16
发明(设计)人: 成丹妮;罗超;胡泓 申请(专利权)人: 携程计算机技术(上海)有限公司
主分类号: G06V20/62 分类号: G06V20/62;G06V30/19;G06V10/82;G06N3/0464;G06N3/084
代理公司: 上海弼兴律师事务所 31283 代理人: 薛琦;张冉
地址: 200335 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 广告 文字 识别 方法 系统 介质 设备
【说明书】:

发明公开了一种基于深度学习的广告文字的识别方法、系统、介质及设备,所述识别方法包括:获取多个文字块,所述文字块包括后期添加文字块以及原始场景文字块;以所述后期添加文字块为正样本,以所述原始场景文字块为负样本训练第一深度学习模型;将含有文字的待检测图像输入训练后的所述第一深度学习模型,以识别所述待检测图像中的文字类别,所述文字类别包括后期添加文字以及原始场景文字;对含有所述后期添加文字的待检测图像进行广告文字识别。本发明通过深度学习算法自动化识别含有广告文字的图像,识别的效率和准确性较高,并且可大幅度节省运营维护成本,净化网络环境,有效提升了互联网环境下的用户浏览体验。

技术领域

本发明涉及图像识别技术领域,具体涉及一种基于深度学习的广告文字的识别方法、系统、介质及设备。

背景技术

在线旅游公司(OTA)在进行业务推广时,通常利用图像(例如:酒店图像、旅游景点图像等)来将信息直观生动的传达给用户,以提升用户体验,进而提高用户的转化率。由于OTA图像的来源比较复杂,供应商在大批量推送图像的时候,往往会混有含不适当广告文字的图像,如限时推销、恶意推广、个人联系方式等,严重影响了用户体验。

现有技术中,通常是通过人工设计搭建特征工程,并利用机器学习算法来识别广告文字,在搭建特征工程的过程中,需要人工定义和提取图像中的可识别的特征(例如:颜色、形状、纹理特征等),特征工程的设计依赖于设计人员的经验,鲁棒性不强,并且针对一个具体场景设计的特征工程往往并不适其他的场景,针对不同的场景,需要重新设计特征工程,极大的限制了机器学习算法的表现性能,整体识别效率和准确性较低,不利于运营成本的优化。

发明内容

本发明要解决的技术问题是为了克服现有技术中通过机器学习算法识别图像中的广告文字,效率低且准确性差的缺陷,提供一种基于深度学习的广告文字的识别方法、系统、介质及设备。

本发明是通过下述技术方案来解决上述技术问题:

一种基于深度学习的广告文字的识别方法,所述识别方法包括:

获取多个文字块,所述文字块包括后期添加文字块以及原始场景文字块;

以所述后期添加文字块为正样本,以所述原始场景文字块为负样本训练第一深度学习模型;

将含有文字的待检测图像输入训练后的所述第一深度学习模型,以识别所述待检测图像中的文字类别,所述文字类别包括后期添加文字以及原始场景文字;

对含有所述后期添加文字的待检测图像进行广告文字识别。

较佳地,所述获取多个文字块的步骤之前包括:以人工标记的含有文字的图像训练第二深度学习模型,所述第二深度模型用于识别图像中是否含有文字;

所述将含有文字的待检测图像输入训练后的所述第一深度学习模型,以识别所述待检测图像中的文字类别的步骤之前包括:将待检测图像输入训练后的第二深度学习模型,以识别所述待检测图像是否含有文字;若是,则执行所述将含有文字的待检测图像输入训练后的所述第一深度学习模型的步骤。

较佳地,所述获取多个文字块的步骤包括:

获取经人工标记的含有文字的图像;

识别所述图像中的所述文字块的中心点以及所述文字块的尺寸;

以所述中心点为中心,从所述图像中裁切得到与所述文字块的尺寸具有不同尺寸比例关系的多个关联文字块。

较佳地,所述对含有所述后期添加文字的待检测图像进行广告文字识别的步骤包括:

判断所述后期添加文字是否与预设的广告关键词匹配;

若是,则确认所述后期添加文字为广告文字,并过滤所述待检测图像;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911250460.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top