[发明专利]一种对视频进行转码的方法和装置有效
| 申请号: | 202010367208.2 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111629211B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 刘安捷 | 申请(专利权)人: | 网宿科技股份有限公司 |
| 主分类号: | H04N19/167 | 分类号: | H04N19/167;H04N19/40;H04N19/70;H04N19/42 |
| 代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 朱鹏程 |
| 地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 进行 方法 装置 | ||
1.一种对视频进行转码的方法,其特征在于,所述方法包括:
基于TensorRT引擎所支持的处理层,对常规语义分割模型进行重构;
将重构后的语义分割模型载入所述TensorRT引擎,生成TensorRT加速模型;
针对不同类型的视频帧图像,调用与待转码视频的目标视频类型和目标帧图像的目标图像类型对应的TensorRT加速模型对所述视频帧图像进行语义分割,生成视频帧图像的多级ROI区域;
采用不同的转码码率对视频帧图像的多级ROI区域和其它区域,分别进行转码处理。
2.根据权利要求1所述的方法,其特征在于,所述语义分割模型为PSPNet模型;
所述基于TensorRT引擎所支持的处理层,对常规语义分割模型进行重构,包括:
将常规PSPNet模型中的自适应池化层和双线性上采样层,分别替换为所述TensorRT引擎所支持的效果相似的处理层。
3.根据权利要求2所述的方法,其特征在于,所述将常规PSPNet模型中的自适应池化层和双线性上采样层,分别替换为所述TensorRT引擎所支持的效果相似的处理层,包括:
将常规PSPNet模型中的自适应池化层替换为多尺度均值池化层;
将常规PSPNet模型中的双线性上采样层替换为转置卷积层。
4.根据权利要求3所述的方法,其特征在于,所述将常规PSPNet模型中的双线性上采样层替换为转置卷积层,包括:
将常规PSPNet模型中多尺度的双线性上采样层替换为最近邻上采样层和共享转置卷积层。
5.根据权利要求1所述的方法,其特征在于,所述将重构后的语义分割模型载入所述TensorRT引擎,生成TensorRT加速模型,包括:
基于预设的训练素材集中的图像素材,定期训练重构后的语义分割模型,生成权值文件,其中,所述图像素材标注有不同实物的各组成部分的轮廓线;
将重构后的语义分割模型的模型文件和所述权值文件载入所述TensorRT引擎,生成TensorRT加速模型。
6.根据权利要求1所述的方法,其特征在于,所述针对不同类型的视频帧图像,调用与待转码视频的目标视频类型和目标帧图像的目标图像类型对应的TensorRT加速模型对所述视频帧图像进行语义分割,生成视频帧图像的多级ROI区域,包括:
获取待转码视频的目标帧图像,基于所述TensorRT加速模型的特征提取模块生成所述目标帧图像的全局特征图;
利用所述TensorRT加速模型的特征分割模块对全局特征图进行特征分割,确定所述目标帧图像中至少一个目标实物的多个组成部分;
基于每个所述组成部分对应的转码优先级,确定所述目标帧图像的多级ROI区域。
7.根据权利要求6所述的方法,其特征在于,所述采用不同的转码码率对所述目标帧图像的多级ROI区域和其它区域分别进行转码处理,包括:
按照转码码率从高至低的顺序,依次选取目标级转码码率;
依据所述目标级转码码率对应的转码面积,按照转码优先级从高至低的顺序,从未被选取的ROI区域中,选取所述目标级转码码率对应的转码区域。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
定期根据当前设备性能负载和线路带宽负载,以及所述待转码视频的属性信息,调整各级转码码率对应的转码面积。
9.根据权利要求6所述的方法,其特征在于,所述确定所述目标帧图像中至少一个目标实物的多个组成部分之后,还包括:
根据所述待转码视频的视频类型和每个所述目标实物的实物类型,调整每个目标实物的组成部分对应的转码优先级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010367208.2/1.html,转载请声明来源钻瓜专利网。





