[发明专利]一种文本检测方法及装置在审

申请号：	202010906380.0	申请日：	2020-09-01
公开（公告）号：	CN112749696A	公开（公告）日：	2021-05-04
发明（设计）人：	王书培;徐耀;袁星宇	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/20;G06K9/00;H04N21/435;H04N21/439;H04N21/488;G10L15/26;G10L15/06
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	李娟
地址：	518044 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种文本检测方法及装置，涉及图像处理技术领域，该方法包括：先获取待处理图像帧，然后对待处理图像帧进行文本显示增强，获得检测帧，再确定检测帧中的文本显示区域，之后再对检测帧中的文本显示区域进行文本信息识别，获得目标文本信息。通过对待处理图像帧进行文本显示增强，使获得的检测帧突出了文本信息的显示，弱化了背景的显示，从而减少了背景以及清晰度对文本检测的影响，提高了文本检测的精度。其次，在进行文本检测之前，先确定文本显示区域，减小了文本检测的范围，通过对文本显示区域进行文本信息识别，获得目标文本信息，提高了文本检测的准确性和效率。

技术领域

本发明实施例涉及图像处理技术领域，尤其涉及一种文本检测方法及装置。

背景技术

随着数字化网络化的发展，数字图像和视频越来越多。由于图像或视频中的文字能够提供直接的语义信息，因此，对文字进行检测有助于理解和管理视频图像。目前对图像数据进行扫描，获取图像中包含的文字信息时，视频或图像的复杂背景和清晰度的问题影响文本检测的准确性。

发明内容

本申请实施例提供了一种文本检测方法及装置，用于提高文本检测的准确性。

一方面，本申请实施例提供了一种文本检测方法，该方法包括：

获取待处理图像帧；

对所述待处理图像帧进行文本显示增强，获得检测帧；

确定所述检测帧中的文本显示区域；

对所述检测帧中的文本显示区域进行文本信息识别，获得目标文本信息。

一方面，本申请实施例提供了一种文本检测装置，该装置包括：

获取模块，用于获取待处理图像帧；

处理模块，对所述待处理图像帧进行文本显示增强，获得检测帧；

定位模块，用于确定所述检测帧中的文本显示区域；

识别模块，用于对所述检测帧中的文本显示区域进行文本信息识别，获得目标文本信息。

可选地，所述处理模块具体用于：

对所述处理图像帧进行灰度处理，将所述待处理图像帧转化为灰度图像；

调整所述灰度图像的对比度参数和亮度调整参数，获得对比度增强图像；

调整所述对比度增强图像的锐化参数，获得检测帧。

可选地，所述定位模块具体用于：

获取参考图像的文本显示区域的上边界位置信息和下边界位置信息；

根据所述上边界位置信息和所述下边界位置信息，从所述检测帧中确定文本显示区域。

可选地，所述待处理图像帧为待处理视频中的视频帧，所述目标文本信息为视频帧中的字幕信息；

所述识别模块还用于：

根据待处理视频中每个视频帧在待处理视频中的时间戳，确定每个视频帧中的字幕信息的时间戳；

根据每个视频帧中的字幕信息的时间戳，确定每个视频帧中的字幕信息在所述待处理视频中对应的时间区间；

对各个时间区间内的字幕信息进行清洗，去除非文本信息以及重复的字幕信息，获得各个时间区间内的目标字幕信息。

可选地，所述识别模块还用于：

针对各个时间区间内的目标字幕信息，保留文字密度位于预设密度范围内的目标字幕信息，删除文字密度不位于预设密度范围内的目标字幕信息；或者

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010906380.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文本检测方法及装置在审

专利文献下载