[发明专利]多分段的媒体文件拼接方法和系统有效
申请号: | 201510553206.1 | 申请日: | 2015-09-01 |
公开(公告)号: | CN105141973A | 公开(公告)日: | 2015-12-09 |
发明(设计)人: | 高上;冷志勇;李凤山;卢述奇 | 申请(专利权)人: | 北京暴风科技股份有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/44 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分段 媒体文件 拼接 方法 系统 | ||
技术领域
本发明涉及媒体文件拼接方法及系统,尤其涉及一种多分段的媒体文件拼接方法和系统。
背景技术
基于开放互联网的移动流媒体服务是将来满足直播、点播以及时移等诸多应用需求的最佳解决方案之一。基于开放互联网的音视频服务,终端可以是电视机、电脑、机顶盒、PAD、智能手机等等。意指在网络之上提供服务,强调服务与物理网络的无关性。对于现在各大音视频网站所提供的媒体内容,绝大多数是采用按时间分割成多个分段的方式来存储和传输一段媒体内容(例如:一部90分钟的电影,可分成9段,每段10分钟),其中的每个分段都是独立完整的媒体文件。
目前的多分段媒体文件有分段FLV文件和分段MP4文件,每个媒体文件(FLV或MP4)分段都由“头信息”和“媒体数据”组成。通常,头信息在媒体文件头部,媒体数据在头信息后直到媒体文件尾。
头信息通常由文件类型、文件播放时长、所含视音频流数量、各音视频流采用的编码标准以及各音视频流所含“帧信息”等描述信息组成。其中,FLV文件的帧信息由各个关键帧在文件中的位置偏移信息和时间偏移信息组成;MP4文件的帧信息由所有帧在文件中的增量位置偏移信息和增量时间偏移信息组成。目前通常的,同属于一段媒体内容的各个分段头信息中的文件类型、所含视音频流数量、各音视频流采用的编码等信息也是一致的。
媒体数据由各视频帧和各音频帧组成。其中,FLV文件的视(音)频帧包含此帧的显示时间戳和编码数据;MP4的视(音)频帧只含有编码数据。
现有技术在播放这种多分段的媒体文件时,是按照列表的方式顺序播放的,即:打开播放器,播放第一段媒体文件,待第一段媒体文件播放结束后“重置播放器”,然后再播放下一段媒体文件……以此类推,直到播放完所有分段后关闭播放器。这里的“重置播放器”指的是在播放器内部重新初始化播放器的过程。
但是,目前的这种“分段播放”存在着明显的缺陷,主要在于:
当这种多分段的媒体文件(例如视频文件)播放时间较短时,每个分段文件的播放时间更短。于是播放器在播放两个连续分段(A、B分段)的切换过程中,会发生A分段播放完成后关闭音视频解码器,关闭文件解复用器,重置播放器到初始状态,重新打开解复用器,重新打开音视频解码器,解析B分段头信息等。然而,这个过程的执行需要一段时间,势必会使A、B分段播放衔接的过程中出现画面短暂停滞和声音短暂停顿(本文称为音视频“短暂中断”)。对于短的分段文件而言,在整个视频的播放过程中会频繁出现“短暂中断”的现象,这严重影响了用户体验。
当这种多分段的视频文件很大时,相应的各个分段的头信息(其设置在视频文件的最开始位置,包含上述提到的视频文件的类型、编码信息以及各关键帧的数据位置偏移和显示时间戳等)也会非常大。这样就造成在线视频的多个分段在下载过程中每次都需要先经过长时间缓存才能把头信息文件下载下来,然后才能逐步播放,这样非常影响客户的体验,客户需要多次等待长时间的缓存才能全部读取完视频文件。
另外,即使用户采用下载离线视频文件后续来播放,针对这种下载的视频文件依然存在分段点,在此分段点处切换来读取播放,这就会导致在播放过程中段与段之间会出现闪烁,或者音频之间停顿等问题。
发明内容
有鉴于此,本申请所要解决的技术问题是提供了一种多分段的媒体文件拼接方法和系统,来解决目前通常的多分段的媒体文件播放时的多次等待或中断的问题。
为了解决上述技术问题,本申请一方面提出了一种多分段的媒体文件拼接方法,包括:
分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息;
根据确定结果,生成待拼接成的整段媒体文件的头信息;
至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据;
利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件。
在一些实施方式中,所述分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京暴风科技股份有限公司,未经北京暴风科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510553206.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:壁虎拖拉机
- 下一篇:一种基于JPEG2000压缩码流进行信息传输的方法