[发明专利]视频字幕的生成方法、装置、设备和存储介质有效
| 申请号: | 202110132044.X | 申请日: | 2021-01-31 |
| 公开(公告)号: | CN112911373B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 张晋;刘青松;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
| 主分类号: | H04N21/431 | 分类号: | H04N21/431;H04N21/435;H04N21/44;H04N21/488 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 字幕 生成 方法 装置 设备 存储 介质 | ||
本发明涉及一种视频字幕的生成方法、装置、设备和存储介质,方法包括:响应于监测的字幕重生成指令,根据视频中的字幕位置截取字幕图片;从所述字幕图片中提取字幕背景;将视频中的字幕内容输入预先训练的多风格字幕生成模型进行处理,得到目标风格的字幕;将所述目标风格的字幕和所述字幕背景叠加,并拼接到所述视频中进行显示,实现了实时动态的以用户所需式样进行显示,从而使得视频能够适用不同用户,提高了视频的适应性。
技术领域
本发明涉及视频播放技术领域,具体涉及一种视频字幕的生成方法、装置、设备和存储介质。
背景技术
作为信息传递的重要媒介,视频在人们生活中具有很重要的地位。通常情况下,大多数视频都配置有字幕,在播放视频的同时,将字幕在视频中进行显示。
现有技术中,视频中的字幕通常以固定形式显示在视频中,对于一些用户而言,可能因为其对视频中的字幕不感兴趣而不再观看该视频,或者,对该视频的评价较低,从而影响视频的播放率。因此,如何实现视频字幕的个性化设置,提高视频的适应性是本领域技术人员亟待解决的技术问题。
发明内容
本发明提供一种视频字幕的生成方法、装置、设备和存储介质,能够解决视频字幕无法个性化设置,导致视频的适应性较低的技术问题。
本发明解决上述技术问题的技术方案如下:
一种视频字幕的生成方法,包括:
响应于监测的字幕重生成指令,根据视频中的字幕位置截取字幕图片;
从所述字幕图片中提取字幕背景;
将视频中的字幕内容输入预先训练的多风格字幕生成模型进行处理,得到目标风格的字幕;
将所述目标风格的字幕和所述字幕背景叠加,并拼接到所述视频中进行显示。
进一步地,上述所述的视频字幕的生成方法中,将视频中的字幕内容输入预先训练的多风格字幕生成模型进行处理,得到目标风格的字幕,包括:
利用所述多风格字幕生成模型的编码器对所述字幕内容进行编码得到字幕向量,并将所述字幕向量与预设的主题分词特征向量进行重组,得到重组向量;
将所述重组向量输入所述多风格字幕生成模型对应的对抗生成网络,得到所述目标风格的字幕。
进一步地,上述所述的视频字幕的生成方法中,所述主题分词特征向量按照如下方式设定:
从预设主题分词中提取所述主题分词特征向量,并设定所述主题分词特征向量;
从自定义主题分词中提取所述主题分词特征向量,并设定所述主题分词特征向量;其中,所述自定义主题分词为对所述预设主题分词进行重新编辑得到,或者,所述自定义主题分词为在自创建模式下用户自创建得到。
进一步地,上述所述的视频字幕的生成方法中,所述视频中的字幕位置按照如下方式获取:
若所述视频的类型为外挂字幕视频,从所述外挂字幕视频中提取字幕文件,并对所述字幕文件进行解析,获取所述字幕位置;
若所述视频的类型为嵌入字幕视频,将所述嵌入字幕视频的预设位置作为所述字幕位置,或者,利用预先训练的文本检测模型获取所述字幕位置。
进一步地,上述所述的视频字幕的生成方法中,所述视频中的字幕内容按照如下方式获取:
若所述视频的类型为外挂字幕视频,从所述外挂字幕视频中提取字幕文件,并对所述字幕文件进行解析,获取所述字幕内容;
若所述视频的类型为嵌入字幕视频,利用预先训练的文本检测模型获取所述字幕内容。
本发明还提供一种视频字幕的生成装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110132044.X/2.html,转载请声明来源钻瓜专利网。





