[发明专利]基于深度强化学习的场景文本检测方法及系统有效
申请号: | 201711352220.0 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108090443B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 黄双萍;王浩彬;金连文 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于深度强化学习的场景文本检测方法及系统,所述方法包括:训练一个特征提取网络;训练一个决策网络;通过特征提取网络和决策网络定位待检测图像上场景文本的位置;其中,所述特征提取网络为场景文本图像特征提取的深度卷积神经网络;所述决策网络为拟合强化学习Q值函数的神经网络。本发明将场景文本检测解析为基于视觉的连续性决策问题,结合强化学习与深度神经网络,模拟日常生活中人眼从整图开始逐渐聚焦到目标物体的过程;在训练过程中,利用深度神经网络,很好地提取出当前定位框图像信息,以强化学习方法训练出能进行目标文本定位的模型。 | ||
搜索关键词: | 基于 深度 强化 学习 场景 文本 检测 方法 系统 | ||
【主权项】:
1.基于深度强化学习的场景文本检测方法,其特征在于:所述方法包括:训练一个特征提取网络;其中,所述特征提取网络为场景文本图像特征提取的深度卷积神经网络;训练一个决策网络;其中,所述决策网络为拟合强化学习Q值函数的神经网络;通过特征提取网络和决策网络定位待检测图像上场景文本的位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711352220.0/,转载请声明来源钻瓜专利网。