[发明专利]一种基于图像识别的视频自动生成方法在审
申请号: | 202211590600.9 | 申请日: | 2022-12-20 |
公开(公告)号: | CN115866355A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 孟洋;张琦;蔡晶 | 申请(专利权)人: | 北京猫眼文化传媒有限公司 |
主分类号: | H04N21/81 | 分类号: | H04N21/81;H04N21/8549;H04N21/44;H04N21/4415;H04N21/435 |
代理公司: | 北京卫智易创专利代理事务所(普通合伙) 16015 | 代理人: | 朱春野 |
地址: | 100010 北京市东城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 识别 视频 自动 生成 方法 | ||
1.一种基于图像识别的视频自动生成方法,其特征在于:其方法包括如下步骤:
(1)首先应用层的业务方根据需要向下层技术端指定发送特定视频请求;
(2)多媒体服务层和底层根据收到的请求,调度分发任务并进行处理;
(3)NLP计算集群和CV计算集群接收任务,并根据文本的关键词和主题进行素材的筛选;
(4)确定生成视频的时长,进行素材的筛选和排序,将素材组成初始视频;
(5)将初始视频与音频和字幕结合,生成最终完整的视频后,整个流程结束。
2.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(1)中,特定视频请求包括但不限于生成影视剧宣传片或者高播放量电影短视频。
3.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(2)中,底层包括NLP底层和CV底层,且NLP底层和CV底层均含有算法、模型和工具,调度分发任务时将请求下发至NLP处理服务和CV处理服务。
4.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(2)中,请求处理内容包括将传入的文字进行文本分析,并提取出文本的主题、关键词。
5.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(3)中,NLP计算集群的功能单元包括实体提取、话题提取、实体热度、话题热度、相关性分析、SEO搜索引擎优化、传播分析和实体链接。
6.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(3)中,CV计算集群的功能单元包括人脸检测识别、表情识别、动作识别、字幕识别、素材召回、语音生成、图像处理和视频生成。
7.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(3)中,筛选出的素材包括对应关键词和主题的视频素材以及音频素材。
8.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(4)中,视频素材的筛选和排序包括如下步骤方法:
1、基于AI的选择和排序方法;
2、人工标注以及排序的方式。
9.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(4)中,基于筛选、排序获取的多个视频片段生成视频集锦,使得多个视频片段组成初始视频。
10.根据权利要求1所述的一种基于图像识别的视频自动生成方法,其特征在于:所述步骤(5)中,根据初始视频在不同视频素材的位置,插入的对应的音频内容,接着对字幕的样式以及内容进行编辑,并使字幕内容与音频相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猫眼文化传媒有限公司,未经北京猫眼文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211590600.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序