[发明专利]视频解说文案的创建方法及装置在审
| 申请号: | 202210538178.6 | 申请日: | 2022-05-17 |
| 公开(公告)号: | CN115082913A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 侯兴林;葛铁铮;姜宇宁 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06N3/04;G06N3/08;G06V10/80;G06V10/82 |
| 代理公司: | 北京乾成律信知识产权代理有限公司 11927 | 代理人: | 姚志远 |
| 地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 解说 文案 创建 方法 装置 | ||
本申请提供一种视频解说文案的创建方、创建装置、电子设备及计算机存储介质。所述创建方法包括:通过语义神经网络模型对获取的视频对象的多模态信息进行理解,获得一组语义向量;通过所述语义神经网络模型建立所述一组语义向量之间的映射关系;根据所述一组语义向量之间的映射关系,将所述一组语义向量融合为多模态语义向量;对所述多模态语义向量进行解码,获得所述视频解说文案。基于对多模态信息的理解和融合,通过训练的语义模型自动生成能够全面反应对象特点的长文案。
技术领域
本申请涉及互联网技术领域,具体涉及一种视频解说文案的创建方法、创建装置、电子设备及计算机可读介质,用于电商类短视频制作。
背景技术
随着流量从图文媒体向视频媒体的转移,视频场景在电商行业变得越来越丰富,也越来越重要。通过视频的方式向消费者展示商品,相较于文字、图片而言的展示方式而言,更加直观、更具有吸引力。因此,视频的展示方式已经成为电商平台主流的商品展示模式。
对于电商而言,视频媒体的要求要明显高于图文媒体。在电商类短视频制作的过程中,不仅需要拍摄视频并进行剪辑,还需要配合音频解说,从而更加直接地向消费者展示商品的特点和卖点。为视频创建一段吸引用户且与视频内容相互呼应的音频解说文案显得尤为关键。
音频解说对视频的创建者而言,不仅要求其具备优秀的文案功底,还要求深入了解商品本身的卖点以及用户的。因此解说文案的创建,对于视频创建者而言,要求高、难度较大。此外,创建的解说文案需要进一步专业配音人员来完成配音并录制音频。对于视频创建者而言,成本较高。因此,根据商品的信息,自动生成符合商品特点和卖点的解说文案,并自动嵌入视频中,将有效降低视频创建的人力和时间成本,提升宣传效率。
发明内容
为了解决自动生成的文案字数较短,将文案嵌入视频的成本较高等问题,本申请提供一种视频解说文案的创建方法、创建装置、电子设备和计算机可读介质。
根据本申请的第一方面,提供的视频解说文案的创建方法,包括:
通过语义神经网络模型对获取的视频对象的多模态信息进行理解,获得一组语义向量;
通过所述语义神经网络模型建立所述一组语义向量之间的映射关系;
根据所述一组语义向量之间的映射关系,将所述一组语义向量融合为多模态语义向量;
对所述多模态语义向量进行解码,获得所述视频解说文案。
根据本申请的一些实施例,所述语义神经网络模型包括,经过学习和训练的语义模型;对所述多模态语义向量进行解码包括,使用经过学习和训练获得的解码模型对所述多模态语义向量进行解码。
根据本申请的一些实施例,所述解说文案的字数包括:80-150字。
根据本申请的一些实施例,所述多模态信息包括:视频、图片、标题、属性中的一种或多种。
根据本申请的一些实施例,所述属性的表达形式包括:表格。
根据本申请的一些实施例,所述创建方法还包括:将所述视频解说文案转换为解说音频,并将所述解说音频嵌入所述视频。
根据本申请的第二方面,提供的短视频解说文案的创建装置,包括:
语义理解模块,用于通过语义神经网络模型对获取的视频对象的多模态信息进行理解,获得一组语义向量;
语义对齐模块,用于通过所述语义神经网络模型建立所述一组语义向量之间的映射关系;
语义融合模块,用于根据所述一组语义向量之间的映射关系,将所述一组语义向量融合为多模态语义向量;
语义解码模块,用于对所述多模态语义向量进行解码,获得所述视频解说文案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210538178.6/2.html,转载请声明来源钻瓜专利网。





