[发明专利]标题生成方法、装置、电子设备和可读存储介质在审
申请号: | 202211657686.2 | 申请日: | 2022-12-22 |
公开(公告)号: | CN115795092A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 于洋 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/738 | 分类号: | G06F16/738;G06F16/783;G06F16/78 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 崔姬玉 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标题 生成 方法 装置 电子设备 可读 存储 介质 | ||
本发明实施例提供了一种标题生成方法、装置、电子设备和可读存储介质,其中,所述方法包括:获取目标视频的视频数据,所述视频数据包括台词文本和视频画面;对所述视频数据进行特征提取,得到文本特征和画面特征,其中,所述文本特征为用于表征所述台词文本的语义,所述画面特征为用于表征所述视频画面的内容;基于所述文本特征和所述画面特征,生成所述目标视频的视频标题。这样,文本特征中的信息与画面特征中的信息在生成视频标题的过程中相互补充,使得生成的视频标题综合考虑了多个模态的信息,丰富了视频标题的信息量,提高了视频标题与视频数据的匹配度。
技术领域
本发明涉及视频技术领域,特别是涉及一种标题生成方法、装置、电子设备和可读存储介质。
背景技术
随着短视频行业的迅速发展,创作出来的视频作品也越来越多。通常每个视频作品中都添加有标题,以便视频观看者通过标题可以快速了解视频作品的大概内容。然而,对于数量庞大的视频作品,即便是视频作者本人也不一定清楚的记得其中某一些视频作品的内容,导致在对视频进行编辑的过程中,需要重新观看视频内容,以确定合适的视频标题,从而导致视频标题生成的工作量较大。
目前,一般通过截取视频中的台词作为该视频的标题,这样,虽然提高了视频标题的生成效率,但是生成的视频标题与视频内容存在匹配度较低的情况,甚至出现视频标题偏离了视频内容要表达的主题的情况。
可见,现有技术中存在视频标题与视频内容匹配度较低的问题。
发明内容
本发明实施例的目的在于提供一种标题生成方法、装置、电子设备和可读存储介质,以解决视频标题与视频内容匹配度较低的问题。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种标题生成方法,包括:
获取目标视频的视频数据,所述视频数据包括台词文本和视频画面;
对所述视频数据进行特征提取,得到文本特征和画面特征,其中,所述文本特征为用于表征所述台词文本的语义,所述画面特征为用于表征所述视频画面的内容;
基于所述文本特征和所述画面特征,生成所述目标视频的视频标题。
在本发明实施的第二方面,提供了一种标题生成装置,包括:
获取模块,用于获取目标视频的视频数据,所述视频数据包括台词文本和视频画面;
特征提取模块,用于对所述视频数据进行特征提取,得到文本特征和画面特征,其中,所述文本特征为用于表征所述台词文本的语义,所述画面特征为用于表征所述视频画面的内容;
生成模块,用于基于所述文本特征和所述画面特征,生成所述目标视频的视频标题。
在本发明实施的第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放程序;
处理器,用于执行存储器上所存放的程序时,实现如第一方面所述的方法。
在本发明实施的第四方面,提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现如第一方面所述的方法。
在本申请实施例中,获取目标视频的视频数据,并对视频数据进行特征提取得到文本特征和画面特征,基于文本特征和画面特征生成目标视频的视频标题,这样,文本特征中的信息与画面特征中的信息在生成视频标题的过程中相互补充,使得生成的视频标题综合考虑了多个模态的信息,丰富了视频标题的信息量,提高了视频标题与视频数据的匹配度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211657686.2/2.html,转载请声明来源钻瓜专利网。