[发明专利]一种文本检测方法及装置在审
申请号: | 202010906380.0 | 申请日: | 2020-09-01 |
公开(公告)号: | CN112749696A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 王书培;徐耀;袁星宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20;G06K9/00;H04N21/435;H04N21/439;H04N21/488;G10L15/26;G10L15/06 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 装置 | ||
本申请实施例提供了一种文本检测方法及装置,涉及图像处理技术领域,该方法包括:先获取待处理图像帧,然后对待处理图像帧进行文本显示增强,获得检测帧,再确定检测帧中的文本显示区域,之后再对检测帧中的文本显示区域进行文本信息识别,获得目标文本信息。通过对待处理图像帧进行文本显示增强,使获得的检测帧突出了文本信息的显示,弱化了背景的显示,从而减少了背景以及清晰度对文本检测的影响,提高了文本检测的精度。其次,在进行文本检测之前,先确定文本显示区域,减小了文本检测的范围,通过对文本显示区域进行文本信息识别,获得目标文本信息,提高了文本检测的准确性和效率。
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种文本检测方法及装置。
背景技术
随着数字化网络化的发展,数字图像和视频越来越多。由于图像或视频中的文字能够提供直接的语义信息,因此,对文字进行检测有助于理解和管理视频图像。目前对图像数据进行扫描,获取图像中包含的文字信息时,视频或图像的复杂背景和清晰度的问题影响文本检测的准确性。
发明内容
本申请实施例提供了一种文本检测方法及装置,用于提高文本检测的准确性。
一方面,本申请实施例提供了一种文本检测方法,该方法包括:
获取待处理图像帧;
对所述待处理图像帧进行文本显示增强,获得检测帧;
确定所述检测帧中的文本显示区域;
对所述检测帧中的文本显示区域进行文本信息识别,获得目标文本信息。
一方面,本申请实施例提供了一种文本检测装置,该装置包括:
获取模块,用于获取待处理图像帧;
处理模块,对所述待处理图像帧进行文本显示增强,获得检测帧;
定位模块,用于确定所述检测帧中的文本显示区域;
识别模块,用于对所述检测帧中的文本显示区域进行文本信息识别,获得目标文本信息。
可选地,所述处理模块具体用于:
对所述处理图像帧进行灰度处理,将所述待处理图像帧转化为灰度图像;
调整所述灰度图像的对比度参数和亮度调整参数,获得对比度增强图像;
调整所述对比度增强图像的锐化参数,获得检测帧。
可选地,所述定位模块具体用于:
获取参考图像的文本显示区域的上边界位置信息和下边界位置信息;
根据所述上边界位置信息和所述下边界位置信息,从所述检测帧中确定文本显示区域。
可选地,所述待处理图像帧为待处理视频中的视频帧,所述目标文本信息为视频帧中的字幕信息;
所述识别模块还用于:
根据待处理视频中每个视频帧在待处理视频中的时间戳,确定每个视频帧中的字幕信息的时间戳;
根据每个视频帧中的字幕信息的时间戳,确定每个视频帧中的字幕信息在所述待处理视频中对应的时间区间;
对各个时间区间内的字幕信息进行清洗,去除非文本信息以及重复的字幕信息,获得各个时间区间内的目标字幕信息。
可选地,所述识别模块还用于:
针对各个时间区间内的目标字幕信息,保留文字密度位于预设密度范围内的目标字幕信息,删除文字密度不位于预设密度范围内的目标字幕信息;或者
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010906380.0/2.html,转载请声明来源钻瓜专利网。