[发明专利]一种用于内容自适应编码中的场景分段方法有效
| 申请号: | 201911062052.0 | 申请日: | 2019-11-01 |
| 公开(公告)号: | CN110677657B | 公开(公告)日: | 2022-02-18 |
| 发明(设计)人: | 万俊青;王建伟;李小强 | 申请(专利权)人: | 杭州当虹科技股份有限公司 |
| 主分类号: | H04N19/137 | 分类号: | H04N19/137;H04N19/142;H04N19/14;H04N19/146;H04N19/179 |
| 代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 贺龙萍 |
| 地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 内容 自适应 编码 中的 场景 分段 方法 | ||
1.一种用于内容自适应编码中的场景分段方法,其特征是,主要由两部分组成,分别是IDR帧决定器和分段决定器,具体的操作步骤如下:
(1)通过IDR帧决定器来设置当前帧是否为IDR帧,如果当前帧是IDR帧则进入到步骤(2)中;否则,设置当前帧为P/B帧;IDR帧决定器的具体流程步骤如下:
(11)在下采样图像上计算每帧帧内预测代价intracost、帧间预测代价intercost、帧间像素差值绝对值和intersad,这里的预测数据采用原图数据;
(12)如果当前帧较前一帧变化很大,设置成IDR帧,否则进入到步骤(13)中;
(13)如果当前帧较前一帧有很大可能突变,且其后N帧的变化缓慢,则将当前帧设置成IDR帧,否则进入到步骤(14)中;
(14)如果当前帧较前一帧有很大可能突变,前N帧变化缓慢,后N帧中变化大但没有可能突变帧,或者后N帧变化缓慢,前N帧中变化大但没有可能突变帧时,则将当前帧设置成IDR帧,否则进入到步骤(15)中;
(15)根据设置的GOP长度来判断当前帧是否到了设置的GOP长度,如果到了则将当前帧设置成IDR帧;否则设置当前帧为P/B帧;
(2)根据分段决定器来确定当前帧是否开始分段,如果开始分段,则将当前帧作为新段编码;否则,继续本段编码;分段决定器的具体流程步骤如下:
(21)如果当前帧是满足IDR帧决定器中步骤(14)的IDR帧,则当前帧开始分段,作为新段编码,否则进入到步骤(22)中;
(22)如果当前帧是IDR帧,前N帧的编码复杂度和后N帧编码复杂度相比变化很大,则当前帧开始分段,否则进入到步骤(23)中;
(23)如果当前帧是IDR帧,前N帧的运动量和后N帧运动量相比变化很大,则当前帧开始分段,否则继续本段编码。
2.根据权利要求1所述的一种用于内容自适应编码中的场景分段方法,其特征是,在步骤(12)中,当前帧较前一帧变化很大的判断条件为:当前帧的帧间预测代价和帧内预测代价的比值大于某个阈值T1,且帧内预测代价和前一帧帧内预测代价差值的绝对值与前一帧intracost的比值大于阈值T2;即:
3.根据权利要求2所述的一种用于内容自适应编码中的场景分段方法,其特征是,在步骤(14)中,具体的操作步骤如下:
(141)统计前N帧和后N帧各自的帧间预测代价最大值premax和afermax,前N帧和后N帧各自的帧间预测代价最小值premin和aftermin;
(142)如果前N帧的变化缓慢,后N帧中没有可能突变帧,且满足premax和aftermin的比值小于阈值T6,则本帧为IDR帧,否则进入到步骤(143)中;
(143)如果后N帧的变化缓慢,前N帧中没有可能突变帧,且满足afermax和premin的比值小于阈值T6,则本帧为IDR帧,否则进入到步骤(15)中。
4.根据权利要求1所述的一种用于内容自适应编码中的场景分段方法,其特征是,在步骤(22)中,IDR帧用帧内预测代价intracost代表编码复杂度,P、B帧用帧间预测代价intercost代表编码复杂度,N帧的编码复杂度按以下公式计算:
costsum=IDR帧的cost总和*ipfactor+P帧的cost总和+B帧的cost总和*pbfacor;
其中:IDR帧的cost指的是帧内预测代价intracost,P帧的cost以及B帧的cost均指的是帧间预测代价intercost,ipfactor和pbfacor是2个预设的固定值;如果前N帧的编码复杂度和后N帧的编码复杂度差值的绝对值大于阈值T8,表示前N帧的编码复杂度和后N帧编码复杂度变化很大。
5.根据权利要求4所述的一种用于内容自适应编码中的场景分段方法,其特征是,在步骤(23)中,帧间像素差值绝对值和intersad代表运动量,如果前N帧的平均运动量和后N帧的平均运动量差值的绝对值大于阈值T9,表示前N帧的平均运动量和后N帧平均运动量变化很大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州当虹科技股份有限公司,未经杭州当虹科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911062052.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:执行调色板解码的方法及解码设备
- 下一篇:基于优先级的非相邻Merge设计
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





