[发明专利]旁白添加方法、旁白添加装置及存储介质有效
申请号: | 202011052217.9 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112235517B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 崔志 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | H04N5/262 | 分类号: | H04N5/262;H04N5/265 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 旁白 添加 方法 装置 存储 介质 | ||
本公开是关于一种旁白添加方法、旁白添加装置及存储介质。旁白添加方法包括:获取视频流,并实时抽取所述视频流中包括的视频帧图像;将实时抽取到的视频帧图像输入预设对象检测模型,通过所述对象检测模型检测所述视频帧图像中存在的对象;将所述各对象的对象向量输入预设的旁白生成模型,以生成所述视频帧图像的旁白;将生成的旁白关联至所述视频帧图像中。通过本公开,可智能地生成表达视频帧图像所传递情感的旁白,提升旁白制作效率,提升用户对视频的观赏体验。
技术领域
本公开涉及图像处理技术领域,尤其涉及旁白添加方法、旁白添加装置及存储介质。
背景技术
随着终端技术的发展,人们已越来越习惯通过终端拍摄视频,以记录生活中的点滴。
为了增加拍摄视频的趣味性以及增加对拍摄视频主题的情感表达,在拍摄视频后,用户往往需要利用第三方软件将用户手动编辑好的文本插入到视频中,使得用户可以随时获取到视频对应的情感表达信息,提高视频的显示效果。
然而,当用户拍摄有多个视频,用户对拍摄的多个视频逐个编辑文本,并将编辑后的文本与拍摄视频合成时,操作繁琐,旁白制作效率低下。
发明内容
为克服相关技术中存在的问题,本公开提供一种旁白添加方法、旁白添加装置及存储介质。
根据本公开实施例的第一方面,提供一种旁白添加方法,旁白添加方法包括:获取视频流,并实时抽取所述视频流中包括的视频帧图像;将实时抽取到的视频帧图像输入预设对象检测模型,通过所述对象检测模型检测所述视频帧图像中存在的对象;将所述各对象的对象向量输入预设的旁白生成模型,以生成所述视频帧图像的旁白;将生成的旁白关联至所述视频帧图像中。
在一示例中,所述旁白生成模型采用如下方式训练得到:收集视频样本文件以及与视频样本文件对应的旁白文件;根据旁白文件中的时间戳信息,截取与旁白同一时间的视频帧图像,得到视频帧图像样本;将同一时间的视频帧图像样本和旁白相关联,得到与视频帧图像样本关联的旁白;将视频帧图像样本输入所述对象检测模型,根据所述对象检测模型检测得到的视频帧图像样本中对象的对象向量;将视频帧图像样本、与视频帧图像样本关联的旁白,以及视频帧图像样本中对象的对象向量作为第一数据集,通过所述第一数据集,训练得到所述旁白生成模型。
在一示例中,通过所述第一数据集,训练得到所述旁白生成模型,包括:将所述视频帧图像样本中对象的对象向量输入序列到序列模型,通过所述序列到序列模型,对所述视频帧图像样本中对象的对象向量进行预测,得到预测旁白;基于损失函数调节所述序列到序列模型,直到通过所述序列到序列模型预测的旁白与所述视频帧图像样本关联的旁白达到预设相似度,得到满足损失值的旁白生成模型。
在一示例中,所述对象检测模型采用如下方式训练得到:调用第二数据集,所述第二数据集包括图像样本以及图像样本中对象所处的位置区域;基于所述第二数据集,训练得到所述对象检测模型。
根据本公开实施例的第二方面,提供一种旁白添加装置,所述旁白添加装置包括:获取单元,被配置为获取视频流,并实时抽取所述视频流中包括的视频帧图像;检测单元,被配置为将实时抽取到的视频帧图像输入预设对象检测模型,通过所述对象检测模型检测所述视频帧图像中存在的对象;生成单元,被配置为将所述各对象的对象向量输入预设的旁白生成模型,以生成所述视频帧图像的旁白;关联单元,被配置为将生成的旁白关联至所述视频帧图像中。
在一示例中,所述装置还包括训练单元;所述训练单元采用如下方式训练得到旁白生成模型:收集视频样本文件以及与视频样本文件对应的旁白文件;根据旁白文件中的时间戳信息,截取与旁白同一时间的视频帧图像,得到视频帧图像样本;将同一时间的视频帧图像样本和旁白相关联,得到与视频帧图像样本关联的旁白;将视频帧图像样本输入所述对象检测模型,根据所述对象检测模型检测得到的视频帧图像样本中对象的对象向量;将视频帧图像样本、与视频帧图像样本关联的旁白,以及视频帧图像样本中对象的对象向量作为第一数据集,通过所述第一数据集,训练得到所述旁白生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011052217.9/2.html,转载请声明来源钻瓜专利网。