[发明专利]一种多媒体视频对象处理方法有效

专利信息
申请号: 200810062899.4 申请日: 2008-07-10
公开(公告)号: CN101409831A 公开(公告)日: 2009-04-15
发明(设计)人: 朱信忠;徐慧英;赵建民;顾海燕;胡丞懿 申请(专利权)人: 浙江师范大学
主分类号: H04N7/24 分类号: H04N7/24;H04N7/26;H04N7/62;G06T5/00;G06T7/20
代理公司: 浙江杭州金通专利事务所有限公司 代理人: 徐关寿
地址: 321004浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种多媒体视频对象处理方法。其步骤包括:(1)基于宏块信息对MPEG视频进行场景分割;(2)预读要拼接的视频,取得各类信息并寻找合适的拼接场景;(3)寻找拼接的入点和出点,对接入视频各种信息进行调整;(4)选取合适的音频拼接点实现音视频无缝拼接;(5)设置视频缓冲区,统一待拼接视频的码率;(6)在时间域对视频内运动对象进行粗提取;(7)对粗提取结果进行分水岭处理,进行时空区域合并精确分割对象。本发明算法简单、高效,系统资源消耗低,处理速度快,精度高。
搜索关键词: 一种 多媒体 视频 对象 处理 方法
【主权项】:
1、一种多媒体视频对象处理方法,其特征是在所述方法包括以下步骤:(1)标准的MPEG视频格式的语法结构的最上层是帧图像组(GOP),由三种主要的压缩类型的图像帧组成,包括I帧、P帧、B帧;一个帧图像组(GOP)可分为3种子类(SGOP),在处理视频时,分别对每个子类(SGOP)中各帧的宏块(MB)的类型进行分析,凡是满足一定规则的,就认为有一个宏块(MB)发生了变化,将各帧发生变化的宏块(MB)个数与总的宏块(MB)个数相比得到镜头变化可能程度c,c越接近1,表明镜头发生转换的几率就越大;设置某个阈值t,若c>t,则认为场景发生了变化,进行分割;(2)预读两个要进行拼接的标准MPEG视频流,分别找到两个视频流的节目关联表(PAT),通过节目关联表(PAT)找到相应的节目映射表(PMT),然后在节目映射表(PMT)里面得到各种信息,主要包括音频、视频和节目时钟基准(PCR)的识别符(PID),并寻找合适的拼接场景;(3)寻找视频拼接的入点和出点,并对接入的视频流的各种信息进行调整,主要包括:视频流的节目专用信息(PSI),音频及视频传输流数据包的识别符(PID),包含节目时钟基准(PCR)的传输流数据包的识别符(PID),以及所有这些传输流数据包的版本号,同时修改第二个视频流的时间信息;(4)根据已经存在的视频拼接点选取合适的音频拼接点,保证音频和视频同步拼接;(5)设置视频缓冲区验证模型(VBV),使解码器输入端有码流缓冲区,使不规则的帧边界规则化;同时通过调节视频流中空包的数量,将进行拼接的两个视频的码率调整为一致,保证视频的无缝拼接;(6)基于变化检测对视频图像进行提取:首先将两帧彩色图像转化为灰度图像,设置合适的阈值得到灰度帧差掩模图像,同理取得HSV彩色空间的帧差掩模图像,两者进行或运算得到联合帧差图像;通过数学形态学的膨胀和腐蚀操作得到运动对象的形状区域并进行提取;(7)对得到的运动对象区域经预处理后进行分水岭变换,并进行时域和空域的区域合并,实现运动对象的精确分割。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江师范大学,未经浙江师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810062899.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top