[发明专利]流媒体视频图像预处理方法有效
申请号: | 201110161785.7 | 申请日: | 2011-06-16 |
公开(公告)号: | CN102281439A | 公开(公告)日: | 2011-12-14 |
发明(设计)人: | 陈长国 | 申请(专利权)人: | 杭州米加科技有限公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N11/04;G06K9/00;G06T5/00 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 310000 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流媒体 视频 图像 预处理 方法 | ||
1. 一种流媒体视频图像预处理方法,其特征在于,包括以下步骤:
步骤一、从视频源取得一帧RGB格式的图像;
步骤二、将RGB格式的图像转换为YUV420格式图像;
步骤三、对YUV420格式图像的Y分量作边缘检测,得到Y分量的边缘2值图像;
步骤四、将YUV420格式图像缩放到固定大小;
步骤五、将Y分量的边缘2值图像也缩放到同样的尺寸;
步骤六、对缩放之后YUV420格式图像的Y分量,作人脸检测,得到人脸区域;
步骤七、对缩放之后的YUV420格式图像的Y分量的非人脸区域和非边缘点,作双边滤波操作;
步骤八、对缩放之后的YUV420格式图像的U、V分量进行双边滤波操作,得到处理以后的图像。
2.根据权利要求1所述的流媒体视频图像预处理方法,其特征在于,所述边缘检测包括以下步骤:
A、首先用2D高斯滤波模板与原始图像进行卷积,以消除噪声;
B、利用一阶偏导有限差分算子找到灰度图像沿着两个方向的导数Gx,Gy,并求出梯度大小和梯度方向;
C、把梯度方向大致分为4个方向(0度,45度,90度,135度),并找到沿这个像素梯度方向的邻接像素;
D、遍历图像,若整个像素的灰度值与梯度方向上前后两个像素的灰度值相比不是最大的,那么将这个像素值置为零,即不是边缘;
E、使用累积直方图计算两个阈值,凡是大于高阈值的一定是边缘,凡是小于阈值的一定不是边缘;如果在两个之间,则根据这个像素的邻接像素中有没有超过高阈值的边缘像素进行判断,如果有,则就是边缘,否则不是边缘。
3.根据权利要求1所述的流媒体视频图像预处理方法,其特征在于,所述步骤四包括:
A、对于Y分量,根据Y分量的边缘2值图像选择插值核函数,如果选择的源象素点处于边缘点,则选择bi-cubic计算插值核函数,否则选择三次B样条插值核函数,此处边缘2值图像信息由步骤三得到;
B、对U,V分量,统一采用B样条做插值核函数进行图像缩放。
4.根据权利要求1所述的流媒体视频图像预处理方法,其特征在于,步骤六中,如果检测不到人脸,则当前图像的人脸位置固定为上一帧图像的人脸位置,如果连续15帧都没有检测到人脸,则把人脸位置移到图像的中心位置。
5.根据权利要求1或4所述的流媒体视频图像预处理方法,其特征在于,每一张图片中人脸个数最大为2。
6.根据权利要求1或2所述的流媒体视频图像预处理方法,其特征在于,所述步骤七包括:
A、对人脸区域,不做滤波操作;
B、对边缘点,不做滤波操作,其中边缘点信息由步骤五得到;
C、其它部分,进行双边滤波。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州米加科技有限公司,未经杭州米加科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110161785.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种FOG热压机
- 下一篇:一种便于调节角度的灯具连接器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序