[发明专利]多媒体文件播放系统、相关方法、装置及设备在审
申请号: | 202010376043.5 | 申请日: | 2020-05-06 |
公开(公告)号: | CN113630620A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 周明智;龙舟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N21/233 | 分类号: | H04N21/233;H04N21/27;H04N21/43;H04N21/439;H04N21/442;H04N5/278;G06F40/58;G06Q10/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 文件 播放 系统 相关 方法 装置 设备 | ||
1.一种多媒体文件播放系统,其特征在于,包括:
客户端,用于针对播放器当前播放的多媒体文件,提取与播放进度对应的音频流;向服务端发送所述音频流;以及,在播放器中显示服务端回送的所述音频流的语音翻译文本;
服务端,用于通过语音翻译模型,确定所述语音翻译文本,向客户端回送所述语音翻译文本。
2.一种多媒体文件播放方法,其特征在于,包括:
针对播放器当前播放的多媒体文件,提取与播放进度对应的音频流;
向服务端发送所述音频流;
在播放器中显示服务端回送的所述音频流的语音翻译文本。
3.根据权利要求2所述的方法,其特征在于,
所述播放器包括浏览器播放器;
所述提取与播放进度对应的音频流,包括:
通过浏览器播放器的数据流捕捉模块,获取所述音频流。
4.根据权利要求2所述的方法,其特征在于,
所述音频流包括毫秒级时长的音频流。
5.根据权利要求2所述的方法,其特征在于,
所述方法还包括:
对所述音频流执行压缩处理;
所述向服务端发送所述音频流,包括:
将压缩后的音频流发送至所述服务端。
6.根据权利要求5所述的方法,其特征在于,所述对所述音频流执行压缩处理,采用以下方式的至少一种:
对所述音频流执行降采样处理;
根据所述音频流的音量数据,对所述音频流执行增益降低处理。
7.根据权利要求6所述的方法,其特征在于,所述对所述音频流执行降采样处理,包括:
确定降采样率;
根据所述降采样率,对所述音频流执行降采样处理。
8.根据权利要求5所述的方法,其特征在于,
所述播放器包括浏览器播放器;
所述对所述音频流执行压缩处理,包括:
根据所述音频流,创建音频输入节点;
根据所述音频输入节点,创建针对所述音频流的音频处理程序;
通过音频处理程序,对所述音频流执行压缩处理。
9.根据权利要求2所述的方法,其特征在于,
所述提取与播放进度对应的音频流,包括:
提取待播放的音频流;
在所述向服务端发送所述音频流之后,通过所述播放器播放所述待播放的音频流,以使得在播放所述待播放的音频流时,显示所述待播放的音频流的语音翻译文本。
10.根据权利要求2所述的方法,其特征在于,还包括:
向服务端发送目标语言信息,以使得服务端将所述音频流翻译为目标语言的文本。
11.一种多媒体文件播放方法,其特征在于,包括:
接收客户端发送的当前播放的多媒体文件的与播放进度对应的音频流;
通过语音翻译模型,确定所述音频流的语音翻译文本;
向客户端回送所述语音翻译文本,以使得客户端在播放所述音频流时,显示所述语音翻译文本。
12.一种多媒体文件播放装置,其特征在于,包括:
音频流提取单元,用于针对播放器当前播放的多媒体文件,提取与播放进度对应的音频流;
音频流发送单元,用于向服务端发送所述音频流;
文本显示单元,用于在播放器中显示服务端回送的所述音频流的语音翻译文本。
13.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现多媒体文件播放方法的程序,该设备通电并通过所述处理器运行该方法的程序后,执行下述步骤:针对播放器当前播放的多媒体文件,提取与播放进度对应的音频流;向服务端发送所述音频流;在播放器中显示服务端回送的所述音频流的语音翻译文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010376043.5/1.html,转载请声明来源钻瓜专利网。