首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]视频字幕的生成方法、装置、设备和存储介质有效

申请号：	202110132044.X	申请日：	2021-01-31
公开（公告）号：	CN112911373B	公开（公告）日：	2023-05-26
发明（设计）人：	张晋;刘青松;梁家恩	申请（专利权）人：	云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
主分类号：	H04N21/431	分类号：	H04N21/431;H04N21/435;H04N21/44;H04N21/488
代理公司：	暂无信息	代理人：	暂无信息
地址：	100096 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频字幕生成方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种视频字幕的生成方法、装置、设备和存储介质，方法包括：响应于监测的字幕重生成指令，根据视频中的字幕位置截取字幕图片；从所述字幕图片中提取字幕背景；将视频中的字幕内容输入预先训练的多风格字幕生成模型进行处理，得到目标风格的字幕；将所述目标风格的字幕和所述字幕背景叠加，并拼接到所述视频中进行显示，实现了实时动态的以用户所需式样进行显示，从而使得视频能够适用不同用户，提高了视频的适应性。

技术领域

本发明涉及视频播放技术领域，具体涉及一种视频字幕的生成方法、装置、设备和存储介质。

背景技术

作为信息传递的重要媒介，视频在人们生活中具有很重要的地位。通常情况下，大多数视频都配置有字幕，在播放视频的同时，将字幕在视频中进行显示。

现有技术中，视频中的字幕通常以固定形式显示在视频中，对于一些用户而言，可能因为其对视频中的字幕不感兴趣而不再观看该视频，或者，对该视频的评价较低，从而影响视频的播放率。因此，如何实现视频字幕的个性化设置，提高视频的适应性是本领域技术人员亟待解决的技术问题。

发明内容

本发明提供一种视频字幕的生成方法、装置、设备和存储介质，能够解决视频字幕无法个性化设置，导致视频的适应性较低的技术问题。

本发明解决上述技术问题的技术方案如下：

一种视频字幕的生成方法，包括：

响应于监测的字幕重生成指令，根据视频中的字幕位置截取字幕图片；

从所述字幕图片中提取字幕背景；

将视频中的字幕内容输入预先训练的多风格字幕生成模型进行处理，得到目标风格的字幕；

将所述目标风格的字幕和所述字幕背景叠加，并拼接到所述视频中进行显示。

进一步地，上述所述的视频字幕的生成方法中，将视频中的字幕内容输入预先训练的多风格字幕生成模型进行处理，得到目标风格的字幕，包括：

利用所述多风格字幕生成模型的编码器对所述字幕内容进行编码得到字幕向量，并将所述字幕向量与预设的主题分词特征向量进行重组，得到重组向量；

将所述重组向量输入所述多风格字幕生成模型对应的对抗生成网络，得到所述目标风格的字幕。

进一步地，上述所述的视频字幕的生成方法中，所述主题分词特征向量按照如下方式设定：

从预设主题分词中提取所述主题分词特征向量，并设定所述主题分词特征向量；

从自定义主题分词中提取所述主题分词特征向量，并设定所述主题分词特征向量；其中，所述自定义主题分词为对所述预设主题分词进行重新编辑得到，或者，所述自定义主题分词为在自创建模式下用户自创建得到。

进一步地，上述所述的视频字幕的生成方法中，所述视频中的字幕位置按照如下方式获取：

若所述视频的类型为外挂字幕视频，从所述外挂字幕视频中提取字幕文件，并对所述字幕文件进行解析，获取所述字幕位置；

若所述视频的类型为嵌入字幕视频，将所述嵌入字幕视频的预设位置作为所述字幕位置，或者，利用预先训练的文本检测模型获取所述字幕位置。

进一步地，上述所述的视频字幕的生成方法中，所述视频中的字幕内容按照如下方式获取：

若所述视频的类型为外挂字幕视频，从所述外挂字幕视频中提取字幕文件，并对所述字幕文件进行解析，获取所述字幕内容；

若所述视频的类型为嵌入字幕视频，利用预先训练的文本检测模型获取所述字幕内容。

本发明还提供一种视频字幕的生成装置，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司，未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110132044.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种单动力双向移动装置和叠片设备
下一篇：一种提升语音识别准确性的方法和设备

同类专利

专利分类

H04 电通信技术
H04N 图像通信，如电视
H04N21-00 可选的内容分发，例如交互式电视，VOD〔视频点播〕
H04N21-20 .专门适用于内容分发的专用服务器，例如：VOD服务器；其操作
H04N21-40 .专门适用于接收内容或者与内容交互的客户端设备，如STB[机顶盒]；相关操作
H04N21-60 .用于在服务器和客户端之间或者在远程客户端之间的视频分配的网络结构或者处理
H04N21-80 .通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身
H04N21-81 ..其单媒体部件

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top