[发明专利]检测文字笔画的方法和装置、定位文字行的方法和装置、判断字幕重复的方法和装置无效
申请号: | 200910078007.4 | 申请日: | 2009-02-09 |
公开(公告)号: | CN101799922A | 公开(公告)日: | 2010-08-11 |
发明(设计)人: | 苗广艺;徐成华;周景超;鲍东山 | 申请(专利权)人: | 北京新岸线网络技术有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海淀区中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 文字 笔画 方法 装置 定位 判断 字幕 重复 | ||
技术领域
本发明涉及对图像中的文字进行处理的技术,尤其涉及一种检测图像中的文字笔画的方法和装置,一种定位图像中的文字行的方法和装置,以及一种判断字幕重复的方法和装置。
背景技术
随着互联网视频内容的不断增加,以及数字图书馆、视频点播、远程教学等大量的多媒体应用,如何在海量视频中检索出所需要的资料显得至关重要。传统的基于关键词描述的视频检索因为描述能力有限、主观性强、手工标注等原因,已经不能满足海量视频检索的需求。因此从20实际90年代开始,基于内容的视频检索技术成为研究的热点问题,而视频字幕的识别技术正是实现视频检索的关键技术。目前提出的视频字幕检测方法,根据所使用的特征,大体可以分为基于区域、基于边缘、基于纹理三种。很多算法实际上综合利用了以上的某两种或全部三种特征。
目前,提出了一种基于笔画的字幕检测方案。基于笔画进行字幕检测的技术方案,需要设计一种笔画滤波器,这种滤波器和传统的边缘纹理滤波器不同,它可以检测到图像中不同尺度的形条结构,对不具有条形结构的边缘和纹理不敏感,这样就会对一些非文字的背景干扰有更好的鲁棒性。
基于笔画检测进行字幕检测的技术方案很有意义,但目前设计的笔画滤波器的应用非常简单,并没有充分考虑到笔画线条亮度一致性、笔画角点和交叉点的影响,降低了笔画检测的效果。
发明内容
有鉴于此,本发明所要解决的技术问题是提供一种检测图像中文字笔画的方法,以提高笔画检测的效果。在一些可选的实施例中,所述检测图像中文字笔画的方法包括:接收图像;计算图像中每个像素点的亮笔画响应值和暗笔画响应值;对每个像素点的亮笔画响应值和暗笔画响应值分别进行处理,获得亮笔画图和暗笔画图;将所述亮笔画图和暗笔画图合并,获得联合笔画图以及笔画的分布。
采用上述实施例检测图像中的文字笔画时,充分考虑到笔画线条亮度一致性、笔画角点和交叉点的影响,从而大大提高了笔画检测的效果。
本发明所要解决的另一个技术问题是提供一种定位图像中的文字行的方法。在一些可选的实施例中,所述定位图像中的文字行的方法包括:接收图像;计算获得所述图像的亮笔画图和暗笔画图;利用所述亮笔画图和暗笔画图,计算获得笔画密度图和文字分布区域;在所述亮笔画图中,利用两种方式对每个文字分布区域投影;将每个文字分布区域分割成至少一个文字行;确定每个文字行的上下边界。
采用上述实施例定位图像中的文字行时,结合了笔画密度和双重投影的优点,可以更加精确地定位文字行,对噪声也有较好的抗干扰性。双重投影定位法在区域聚合的基础上,利用笔画分布特点,优化了文字行定位的结果,使得文字行的边界更加精确。
本发明所要解决的另一个技术问题是提供一种判断字幕重复的方法。在一些可选的实施例中,该方法包括:在前一图像文字行定位之后,保存前一图像的文字行位置、图像内容,以及笔画分布图;在定位当前图像的文字行之前,利用保存的信息判断当前图像和前一图像的文字行距离是否大于第五阈值;如果大于,则对当前图像的文字行进行定位;否则,沿用前一图像的文字行定位结果。
本发明所要解决的另一个技术问题是提供一种检测图像中文字笔画的装置。在一些可选的实施例中,所述检测图像中文字笔画的装置包括接收图像的接收单元,还包括:计算图像中每个像素点的亮笔画响应值和暗笔画响应值的第一单元;对每个像素点的亮笔画响应值和暗笔画响应值分别进行处理,获得亮笔画图和暗笔画图的第二单元;和,将所述亮笔画图和暗笔画图合并,获得联合笔画图以及笔画的分布的第三单元。
本发明所要解决的另一个技术问题是提供一种定位图像中的文字行的装置。在一些可选的实施例中,所述定位图像中的文字行的装置包括接收图像的接收单元,还包括:计算图像中每个像素点的亮笔画响应值和暗笔画响应值的第一单元;对每个像素点的亮笔画响应值和暗笔画响应值分别进行处理,获得亮笔画图和暗笔画图的第二单元;利用所述亮笔画图和暗笔画图,计算获得笔画密度图和文字分布区域的第四单元;在所述亮笔画图中,利用两种方式对每个文字分布区域投影的第五单元;将每个文字分布区域分割成至少一个文字行的第六单元;和,用于确定每个文字行的上下边界的第七单元。
在定位文字行的时候,使用区域聚合算法形成笔画密度图,对文字区域的粗定位有很好的效果。利用亮笔画图的笔画信息进行双重投影,可以精确地定位出每一个文字行的上下边界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新岸线网络技术有限公司,未经北京新岸线网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910078007.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:太阳灶自动跟踪装置
- 下一篇:具有隔热挂架的热水器