[发明专利]视频文件的标注方法及装置在审

申请号：	201610364407.1	申请日：	2016-05-26
公开（公告）号：	CN105872855A	公开（公告）日：	2016-08-17
发明（设计）人：	何新超	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	H04N21/84	分类号：	H04N21/84;H04N21/845;H04N21/85;H04N21/8547
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	郭晶
地址：	510000 广东省广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种视频文件的标注方法及装置，属于音频处理技术领域。该方法包括：获取建模视频文件；从建模视频文件中，提取建模音频文件；从建模音频文件中，识别出多个音频片段，每个音频片段对应一个音频标签；对于任一音频片段，将音频片段划分为多帧音频信号；从每帧音频信号中，提取音频帧特征；对音频帧特征进行归一化处理，得到特征向量；根据特征向量及相应的音频标签，构建音频标注模型；根据音频标注模型，为待标注的视频文件，添加音频标签。本发明无需借助人力，基于所构建的音频识别模型为待标注的视频文件添加不同的音频标签，在满足用户预览需求的前提下，不仅节省了制作成本，而且提高了标注效率及辨识度。
搜索关键词：	视频文件标注方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种视频文件的标注方法，其特征在于，所述方法包括：获取建模视频文件；从所述建模视频文件中，提取建模音频文件；从所述建模音频文件中，识别出多个音频片段，每个音频片段对应一个音频标签；对于任一音频片段，将所述音频片段划分为多帧音频信号；从每帧音频信号中，提取音频帧特征；对所述音频帧特征进行归一化处理，得到特征向量；根据所述特征向量及相应的音频标签，构建音频标注模型；根据所述音频标注模型，为待标注的视频文件，添加音频标签。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司，未经广州酷狗计算机科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610364407.1/，转载请声明来源钻瓜专利网。

上一篇：一种骨传导耳机工作模式的切换方法、装置及骨传导耳机
下一篇：基于白名单的直播数据推送方法及设备

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N21-00 可选的内容分发，例如交互式电视，VOD〔视频点播〕
H04N21-20 .专门适用于内容分发的专用服务器，例如：VOD服务器；其操作
H04N21-40 .专门适用于接收内容或者与内容交互的客户端设备，如STB[机顶盒]；相关操作
H04N21-60 .用于在服务器和客户端之间或者在远程客户端之间的视频分配的网络结构或者处理
H04N21-80 .通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身
H04N21-81 ..其单媒体部件

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]视频文件的标注方法及装置在审

专利文献下载