[发明专利]媒体素材处理方法、装置、设备、服务器及存储介质有效
申请号: | 202010370079.2 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111526405B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 郭燧冰;廖凯恩;朱康峰;张倩;刘柏;范长杰;李仁杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | H04N21/43 | 分类号: | H04N21/43;H04N21/8352;G06F16/48;G11B27/031 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 刘静 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 素材 处理 方法 装置 设备 服务器 存储 介质 | ||
1.一种媒体素材处理方法,其特征在于,所述方法包括:
在待标注媒体素材播放的过程中,获取通过预设标注界面输入的针对所述待标注媒体素材的标注信息,其中,所述待标注媒体素材包含视频轨道和音频轨道;
根据所述标注信息,对所述待标注媒体素材进行标注;
其中,在对所述待标注媒体素材进行标注之前,所述方法包括:
将所述视频轨道和所述音频轨道的时间轴进行对齐,以获得所述待标注媒体素材;
其中,所述将所述视频轨道和所述音频轨道的时间轴进行对齐,包括:
对所述音频轨道和预设音频轨道的时间轴进行对齐,所述预设音频轨道为与所述视频轨道的时间轴对齐的音频轨道;
其中,对所述音频轨道和预设音频轨道的时间轴进行对齐,包括:
检测所述音频轨道和所述预设音频轨道中是否均具有语音数据;
若所述音频轨道和所述预设音频轨道中均有语音数据,则分别对所述音频轨道和所述预设音频轨道进行语音转写处理;
根据所述语音转写处理的结果,分别确定所述音频轨道和所述预设音频轨道中第一条语音的开始时间;
根据所述音频轨道和所述预设音频轨道中第一条语音的开始时间,对所述音频轨道和所述预设音频轨道的时间轴进行对齐。
2.根据权利要求1所述的方法,其特征在于,所述将所述视频轨道和所述音频轨道的时间轴进行对齐,包括:
获取通过所述预设标注界面输入的所述视频轨道和所述音频轨道的时间轴移动操作;
响应所述时间轴移动操作,对所述视频轨道和所述视频轨道的时间轴进行对齐。
3.根据权利要求1所述的方法,其特征在于,所述对所述音频轨道和预设音频轨道的时间轴进行对齐,包括:
若所述音频轨道和所述预设音频轨道中不具有语音数据,则根据所述音频轨道和所述预设音频轨道对应波形的振幅,对所述音频轨道和所述预设音频轨道的时间轴进行对齐。
4.根据权利要求3所述的方法,其特征在于,所述根据所述音频轨道和所述预设音频轨道对应波形的振幅,对所述音频轨道和所述预设音频轨道的时间轴进行对齐,包括:
根据所述音频轨道和所述预设音频轨道对应波形的振幅,计算时间偏移量;
根据所述时间偏移量,对所述音频轨道和所述预设音频轨道的时间轴进行对齐。
5.根据权利要求1所述的方法,其特征在于,所述获取通过预设标注界面输入的所述待标注媒体素材的标注信息之前,所述方法还包括:
接收通过所述预设标注界面上输入的区域划分操作;
根据所述区域划分操作确定所述预设标注界面上至少一个标注区域的起止位置,所述起止位置根据所述标注信息确定,每个所述标注区域对应不同的标注信息。
6.根据权利要求5所述的方法,其特征在于,所述获取通过预设标注界面输入的所述待标注媒体素材的标注信息,包括:
获取通过所述预设标注界面上所述至少一个标注区域输入的所述标注信息。
7.根据权利要求5所述的方法,其特征在于,所述获取通过预设标注界面输入的所述待标注媒体素材的标注信息,包括:
获取通过所述预设标注界面上所述至少一个标注区域选择的标签信息。
8.根据权利要求1-7中任一所述的方法,其特征在于,所述标注信息包括如下至少一种信息:所述待标注媒体素材对应的语音转写文字、人物动作、人物语气、人物表情。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010370079.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钼基高温合金的TLP焊接方法
- 下一篇:程序的升级方法、设备、系统和介质