[发明专利]一种基于图像识别的视频自动生成方法在审
| 申请号: | 202211590600.9 | 申请日: | 2022-12-20 |
| 公开(公告)号: | CN115866355A | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 孟洋;张琦;蔡晶 | 申请(专利权)人: | 北京猫眼文化传媒有限公司 |
| 主分类号: | H04N21/81 | 分类号: | H04N21/81;H04N21/8549;H04N21/44;H04N21/4415;H04N21/435 |
| 代理公司: | 北京卫智易创专利代理事务所(普通合伙) 16015 | 代理人: | 朱春野 |
| 地址: | 100010 北京市东城*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图像 识别 视频 自动 生成 方法 | ||
本发明涉及视频图像识别技术领域,尤其为一种基于图像识别的视频自动生成方法,其方法包括如下步骤:首先应用层的业务方根据需要向下层技术端指定发送特定视频请求,多媒体服务层和底层根据收到的请求,调度分发任务并进行处理,NLP计算集群和CV计算集群接收任务,并根据文本的关键词和主题进行素材的筛选;确定生成视频的时长,进行素材的筛选和排序。本发明具有通过深度学习等技术,实现在无人工干预的情况下,对素材的筛选以及拼接的优点,可以快速、实时、精确的将社会娱乐热点问题视频化,让用户快速的了解相关的新闻事件,与此同时,生成电影、电视剧的宣传以及收视状况短视频,减少了宣传发行的人力成本,同时提高了宣传发行的效率。
技术领域
本发明涉及视频图像识别技术领域,具体为一种基于图像识别的视频自动生成方法。
背景技术
除了网络快速的发展,近些年来,深度学习在音频、图像、自然语言上都取得了巨大的成就,已经成为众多学者以及高校实验室研究的重点和热点。其中卷积神经网络拥有强大的图像特征提取能力,广泛用于图像领域,在ImageNet等公开数据集上取得优异的成绩,分类准确率远远超过利用传统方法实现的分类结果。除此之外,循环神经网络的发展也与日俱进,相较于卷积神经网络无法对时间序列上的变化进行建模,循环神经网络可以满足序列数据的输入,因此广泛应用于文本、图像、音频、序列中,如语音识别、机器翻译、文本生成等。由此可见,深度学习由于其强大的特征提取能力、建模能力以及学习能力被广泛的应用到各个领域。
随着网络技术的快速发展,视频逐渐占据人们日常生活越来越多的时间。相较于简单的文本内容,视频可以更加从视觉、听觉多个纬度给用户带来信息的内容。在短视频平台中,大多视频都是用户或者平台通过人工的手段,人工选择相应的素材,然后通过剪辑软件等拼接素材,添加音频组装成一个完整的视频,缺点十分明显,无论进行素材的涮选,还是视频的拼接,都十分消耗人力。除此之外,效率也是十分低下,制作一个视频要消耗大量的时间,无法跟上社会以及娱乐热点时间的速度。
传统的各个短视频平台的视频大都是基于人工的手段来制作,如相关职业视频剪辑师,通过制作视频的主题,在海量的互联网资源中,挑选需要的素材,然后通过相关剪辑软件来实现对素材的拼接,以及给视频添加特效、字幕、音频等,这种过程无论是素材的选取以及制作视频的工程,都是十分费时耗力的,除此之外,效率也是十分低下,制作一个视频要消耗大量的时间,无法跟上社会以及娱乐热点时间的速度。为此我们提出一种基于图像识别的视频自动生成方法,实现一个自动化的视频生成服务,来提高视频生成的智能化和效率化。
发明内容
本发明的目的在于提供一种基于图像识别的视频自动生成方法,具有通过深度学习等技术,实现在无人工干预的情况下,对素材的筛选以及拼接的优点,解决了目前素材的选取以及制作视频的工程,都是十分费时耗力的,除此之外,效率也是十分低下,制作一个视频要消耗大量的时间,无法跟上社会以及娱乐热点时间的速度的问题。
为实现上述目的,本发明提供如下技术方案:一种基于图像识别的视频自动生成方法,其方法包括如下步骤:
(1)首先应用层的业务方根据需要向下层技术端指定发送特定视频请求;
(2)多媒体服务层和底层根据收到的请求,调度分发任务并进行处理;
(3)NLP计算集群和CV计算集群接收任务,并根据文本的关键词和主题进行素材的筛选;
(4)确定生成视频的时长,进行素材的筛选和排序,将素材组成初始视频;
(5)将初始视频与音频和字幕结合,生成最终完整的视频后,整个流程结束。
优选的,所述步骤(1)中,特定视频请求包括但不限于生成影视剧宣传片或者高播放量电影短视频。
优选的,所述步骤(2)中,底层包括NLP底层和CV底层,且NLP底层和CV底层均含有算法、模型和工具,调度分发任务时将请求下发至NLP处理服务和CV处理服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猫眼文化传媒有限公司,未经北京猫眼文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211590600.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





