[发明专利]多媒体播放方法及装置有效
申请号: | 201410250800.9 | 申请日: | 2014-06-06 |
公开(公告)号: | CN104038827B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 王斌;郑志光;纪东方 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | H04N21/462 | 分类号: | H04N21/462;H04N21/439;H04N21/472 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 播放 方法 装置 | ||
技术领域
本公开涉及多媒体处理技术领域,尤其涉及一种多媒体播放方法及装置。
背景技术
相关技术中,在播放视频的时候,经常会出现暂停,包括因为用户主观原因的主动暂停,也包括由于网络的原因,出现短暂的卡顿暂停。由于暂定的时刻机动性比较大,在继续播放的时候,视频里面出现的声音往往是从一个句子的中间开始,甚至从一个字或者词的一半开始,这样不便于人们连续地理解情节。
相关技术中,一些多媒体播放软件或网页,在播放过程中关闭软件或网页后,当再次开启软件播放同一视频或重新打开上次关闭的视频网页时,也会采取在暂停位置返回固定时间量的回退播放方式。例如,返回的时间值固定设置为5秒,则当中断后重新开启软件或网页,继续播放原视频时,从中断点之前的5秒开始播放,以便用户接续到上次观看的记忆。
这种回退播放方式,后退的时间值是预先设定的固定值,虽然给予用户一定回想的时间,但是切入的时间点比较生硬,不够人性化。因为即使后退5秒,也会出现从一个句子的中间开始继续播放的情况,不利于用户理解完整的语句。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种多媒体播放方法及装置。
根据本公开实施例的第一方面,提供一种多媒体播放方法,包括:
获取多媒体的暂停位置之前第一预设时长的音频数据和/或字幕数据;
根据所述音频数据和/或字幕数据确定完整语句的语句起始位置;
当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述语句起始位置继续播放所述多媒体。
本实施例中,通过分析音频数据和/或字幕数据,确定一句完整语句的语句起始位置,根据确定的语句起始位置继续播放视频或音频,使得在暂停后继续播放时用户可以捕捉并理解到完整的语句,视频或音频里的对话更自然,情节更连续,提高用户对视频或音频播放的体验度。
可选的,所述根据所述音频数据确定完整语句的语句起始位置,包括:
检测所述音频数据中相邻两个音频信号之间的时间间隔;
当相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,确定所述相邻两个音频信号之间的任一时间位置为所述语句起始位置。
可选的,所述根据所述字幕数据确定完整语句的语句起始位置,包括:
获取所述字幕数据中每条字幕的起始显示时间和/或终止显示时间;
根据所述字幕的起始显示时间和/或终止显示时间确定所述语句起始位置。
可选的,所述根据所述音频数据和字幕数据确定完整语句的语句起始位置,包括:
检测所述音频数据中每个音频信号的播放时间;
当相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,获取所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间;
根据所述相邻两个音频信号的播放时间及所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间确定所述语句起始位置。
在可选方案中,通过根据相邻音频信号之间的时间间隔或相邻字幕之间的时间间隔确定语句起始位置,使得后续可以根据语句起始位置继续播放音频或视频,用户继续播放时可以捕捉并理解到完整的语句,视频或音频里的对话更自然,情节更连续,提高用户对视频或音频播放的体验度。另外,同时对音频数据和字幕数据进行分析,确定两个完整语句之间的间隔位置,从而更精确地获得完整语句的起始点,不仅不会影响到用户对语句的理解,也不会影响到用户观看到字幕。
可选的,所述根据所述音频数据确定完整语句的语句起始位置,包括:
根据人声频率对所述音频数据进行过滤,得到人声音频数据;
检测所述人声音频数据中相邻两个人声音频信号之间的时间间隔;
当相邻两个人声音频信号之间的时间间隔大于所述第一预设间隔时长时,确定所述相邻两个人声音频信号间之间的任一时间位置为所述语句起始位置。
在可选方案中,按照人声通常的频率先对音频数据过滤,从而单纯对人声音频信号进行分析,根据人声音频信号之间的时间间隔确定语句起始位置,使得对语句起始位置的确定更加准确。
可选的,当根据所述音频数据和/或字幕数据确定出至少两个完整语句的语句起始位置时,所述根据所述语句起始位置继续播放所述多媒体,包括:
从距离所述暂停位置最近的语句起始位置继续播放所述多媒体;或者
当预设的回退语句数量为N时,从所述暂停位置之前的第N个语句起始位置继续播放所述多媒体,所述N为大于或等于2的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410250800.9/2.html,转载请声明来源钻瓜专利网。