[发明专利]一种音视频多路并发解码加速卡及其解码加速方法有效
申请号: | 201510052534.3 | 申请日: | 2015-02-02 |
公开(公告)号: | CN104683860B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 张勇东;包秀国;袁庆升;张冬明;马宜科;靳国庆;崔洪亮;孔祥兵;窦晋津 | 申请(专利权)人: | 北京神州天脉网络计算机有限公司 |
主分类号: | H04N21/432 | 分类号: | H04N21/432;H04N21/4405;H04N21/434;H04N21/435;H04N21/462 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 并发 解码 加速卡 及其 加速 方法 | ||
本发明提供一种音视频多路并发解码加速卡,包括解码处理器和内存,所述解码处理器包括通用处理器,系统代理模块,末级高速缓存模块,以及多种硬件解码加速模块;所述通用处理器和所述硬件解码加速模块共享末级高速缓存,末级高速缓存通过所述系统代理模块连接内存。内存中设置硬件和软件待解码数据缓冲区;通用处理器用于根据是否可以进行硬件加速解码将待解码帧数据送入硬件或是软件待解码数据缓冲区;通用处理器软件和硬件解码线程分别将各自相应的缓冲区数据取出解码。本发明还提供了相应的解码加速方法。本发明能够提供强大的音视频解码加速能力,能够在多种格式、多种解码器下快速切换,可以应对上千路的并发解码请求。
技术领域
本发明涉及音视频解码技术领域,具体地说,本发明涉及一种音视频多路并发解码加速卡及其解码加速方法。
背景技术
网络音视频流量巨大,尤其对于优酷等内容提供商,每分钟用户上传音视频量长达数小时,而这些音视频文件必须要在10多分钟内进行盗版检测、不良信息检测、内容分类等基于音视频内容分析的自动处理工作。音视频数据以压缩形式传输,而内容分析必须基于音频原始波形数据和视频原始图像数据,因此数据解码是内容分析必不可少的前置条件。而互联网用户使用的音视频文件格式多种多样,其中常见的有FLV、WMV、ASF、RMVB、AVI、MP4等,这些文件格式通常用于封装多种编码器进行编码的音视频流,常见的编码器有H.264/AVC、H.265/HEVC、VP8、VP9、VC-1、MPEG1/2/4、RV8/9/10等。然而,目前音视频解码多是针对播放器实时播放需求的,其设计能力只需达到单路视频30fps的帧率即可。而面向内容分析的音视频解码器需要与强大的机器处理能力对应,每秒解码处理能力需要达到数千甚至上万帧。并且,内容提供商所面临的数据解码需要单处理节点能够同时处理多路多种格式的音视频流的并发解码请求,上述应用需求传统播放器类解码器均无法满足,因此需要针对音视频多路并发高速解码需求设计出新的解决方案。
目前,通用服务器适用于进行数据分析等传统业务处理,而对音视频解码不能提供专用加速逻辑,无法发挥其计算性能。因此,设计单独的硬件与通用服务器连接并为其提供解码服务,是一种较佳的方案。针对解码需求接入带宽高的特点和通用服务器高带宽接口的特点,带有PCIe接口的解码硬件是最佳选择,该解码硬件通常被设计为PCIe接口的解码加速卡形式,以便接入服务器。现有技术中,一种典型的PCIe接口解码加速卡是基于DSP处理器的音视频解码加速卡,它的主处理器通常是TI的集成ARM核的Netra处理器,代表性的产品为海康威视等公司的高清视频多路解码显示设备。该类解码加速卡主要用于监控摄像头的多路同时回放,解码设备同时接收多路监控设备的音视频流,进入解码设备后,单片TI处理器最多可进行8路高清解码,解码格式包括H.264、MPEG4、MPEG2、MJPEG等,解码后的数据直接接入显示设备进行显示。然而,该方案仅适合单格式多路并发的音视频处理。因为DSP中专用的解码加速器解码一种格式时,需要切换相应的固件,这种切换效率很低,而多格式并发视频解码的特点决定了需要在多个解码器之间频繁切换,甚至解一帧之后,由于当前视频没有数据,就要切换到另一路另一个格式的视频解码,此时固件切换速度甚至比解一帧的速度还慢,无法发挥其加速性能。
现有技术中,高性能GPU也可以看作一种PCIe接口解码加速卡。其缺点在于功耗大,且解码应用需要频繁跳转不利于GPU编程模型发挥效率。GPU每一次跳转操作都导致大量的计算单元停止工作等待重新分发数据,而解码算法中存在大量的跳转操作,因此这类高性能GPU在解码方面的效率很低。
另外,目前市场上还有一种基于众核处理器的PCIe接口解码加速卡,其代表产品是Tilera公司的tilepro64和tilegx系列芯片。众核处理器内集成数十个(例如64个)通用处理器核,各个通用处理器核内集成了部分向量指令,可用于视频解码的部分算法加速。然而,众核处理器处理多路多格式并发音视频解码应用存在以下问题:
1、单核处理能力有限,处理分辨率大的视频(如FHD视频)时存在延迟大的问题,严重影响分析系统实时性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州天脉网络计算机有限公司,未经北京神州天脉网络计算机有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510052534.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电视远程文本输入方法
- 下一篇:逐行显示终端及其视频播放方法、图像处理装置