[发明专利]一种基于对象的视频转码方法和装置有效
申请号: | 201210093888.9 | 申请日: | 2012-04-01 |
公开(公告)号: | CN102630043A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 肖炳珠;魏东亮;郝晔明 | 申请(专利权)人: | 北京捷成世纪科技股份有限公司 |
主分类号: | H04N21/2343 | 分类号: | H04N21/2343 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对象 视频 方法 装置 | ||
技术领域
本发明属于视频编码技术领域,尤其涉及一种基于对象的视频转码方法和装置,用于在视频转码中隔离蚊式噪声。
背景技术
视频技术和视频压缩标准的不断发展以及视频节目在不同应用环境中的需要,促使了视频转码研究的出现和不断发展。目前,视频转码技术已被人们广泛研究.具体来说,视频转码就是从一种视频编码流到另一种编码流的转换,目的是把输入的压缩流转换成符合接收端要求的压缩流。
在数字电视广播领域和IPTV系统中的视频服务器端,为了使不同带宽的用户能够收看视频点播,视频服务器端需要利用转码器将高码率视频转换为低码率视频,视频码流的下降直接导致了图像质量下降,通常都需要对图像进一步增强,常用的增强方式是利用一些模板算子进行锐化处理,其结果表现为图像细节得到增强,图像更加清晰,但也同时在文字区域产生了蚊式噪声,导致视频图像出现闪烁。
为了消除蚊式噪声,很多研究者从图像处理本身的角度开发了一系列技术解决相关问题,Anchor Bay研发了一个私有的不是很普遍的移除“蚊式噪音”以及其他压缩导致的伪影的方法,区别于那些通过移除太多细节或在动作画面引起混淆画面的方法来使得图像变得更差的降噪方法,VRS降噪的设计隔离了大多数令人讨厌的伪影。为了做到这点,Anchor Bay寻找到了画面中最有可能出现噪点的地方,并对其进行隔离和预示。另外,郑世宝等人提出一种利用边缘检测、运动检测和中值滤波去除蚊式噪声的方法,即先对图像进行帧内处理,然后对经过帧内处理的连续的三帧图像进行帧间处理。具体为:使用Lapalace算子对图像进行边缘检测,得到每个像素的边缘信息,如果某一像素为边缘像素或者它周围的四个像素中有两个以上的边缘像素,保留其值不变;否则,用一个中值滤波器对该像素进行滤波处理;进行运动检测,根据相邻帧之间的差异,判断当前帧中的像素是否运动,如果该像素是运动像素,则保留其值不变;如果是非运动像素,则将三帧中的对应点进行中值滤波的结果作为该像素的滤波结果。上述方法中的主要的缺陷是他们并不能从根本上解决消除纹式噪声,而且还增加了而外的计算开销。
发明内容
鉴于现有技术的缺陷,本发明提供一种基于对象的视频转码方法,其特征在于包括如下步骤:
步骤一、对输入视频流进行完全解码;
步骤二、检测视频图像中文字区域并定位区域坐标;
步骤三、利用坐标信息将整幅视频图像分为两个部分,一部分为文字区域,另一部分为非文字区域;
步骤四、对于文字区域进行隔离,对于非文字区域,采用彩色图像锐化进行增强;
步骤五、对于两部分区域分别进行编码,并对两部分进行图像融合产生重新转码之后的图像。
进一步,本发明所述的基于对象的视频转码方法,其特征在于步骤二具体为:先将待转码视频解码为YUV格式,对Y分量计算图像边缘,并计算整个图像的边缘密度,得到一幅边缘密度图像,利用otsu的方法对密度图进行分割并进行膨胀腐蚀操作,得到候选文字区域,然后利用事先训练好的SVM文字分类器进行识别,进而定位文字区域并得到区域坐标大小。
进一步,本发明所述的基于对象的视频转码方法,其特征在于步骤四中对图像进去增强的步骤具体包括:利用高斯滤波器对Y分量图像进行滤波得到滤波图像F,将图像Y和F做差得到差分图像,再将差分图像乘以一个放大系数,最后将差分图像叠加到滤波图像上就得到了最终的边缘增强图像。
进一步,本发明所述的基于对象的视频转码方法,其特征在于步骤五中对文字区域进行编码的具体步骤为:根据文字区域的位置信息,取得到相应的宏块的位置,然后对有文字的宏块进行单独的编码。
此外,本发明还提供一种基于对象的视频转码装置,其特征在于包括如下模块:
解码模块,用于对输入视频流进行完全解码;
文字区域定位模块,用于检测视频图像中文字区域并定位区域坐标;
图像分割模块,用于利用坐标信息将整副视频图像分为两个部分,一部分为文字区域,另一部分为非文字区域;
彩色图像增强模块,用于对于文字区域进行隔离,并对于非文字区域,采用彩色图像锐化进行增强;
编码模块,用于对于两部分区域分别进行编码,并对两部分进行图像融合产生重新转码之后的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷成世纪科技股份有限公司,未经北京捷成世纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210093888.9/2.html,转载请声明来源钻瓜专利网。