[发明专利]一种编辑视频的方法和装置在审
申请号: | 201710602551.9 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107493442A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 陈杰 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | H04N5/265 | 分类号: | H04N5/265;H04N5/445;G06F17/30;G06T5/50 |
代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 房德权 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编辑 视频 方法 装置 | ||
技术领域
本发明涉及电子技术领域,尤其涉及一种编辑视频的方法和装置。
背景技术
为了增强观看体验,视频制作人员往往会在视频中添加一下增强效果的显示对象。举例来说,当视频中的人物突然大叫“啊”,则在视频中添加一个感叹号“!”,和/或添加一个文字符为“啊”字的贴纸;当视频中的人物大笑时,则在视频中添加大笑的动态表情。
然而,在现有技术中,上述在视频中添加增强效果的显示对象几乎完全依赖于视频制作人员的后期编辑。因此,现有技术中编辑视频的方法存在人工依赖程度高的技术问题。
发明内容
本发明实施例提供了一种编辑视频的方法和装置,用于实现降低视频编辑对人工依赖的程度,自动对视频文件或视频流进行编辑的技术效果。
第一方面,本发明提供了一种编辑视频的方法,包括:
对视频文件或视频流所包含的音频帧进行识别,识别出音量和/或声纹满足预设条件的目标音频帧,所述视频文件或视频流还包含与每帧音频帧对应的视频帧;
确定所述目标音频帧对应的用于增强效果的显示对象;
根据所述目标音频帧确定对应的目标视频帧;
将所述显示对象添加到所述目标视频帧的图像中。
可选的,所述预设条件包括所述音频帧的声纹能够与一预设声纹匹配;
所述对视频文件或视频流所包含的音频帧进行识别,识别出声纹满足预设条件的目标音频帧,包括:
提取所述视频文件或视频流每帧所述音频帧的声纹;
将每帧所述音频帧的声纹与一个或多个所述预设声纹进行匹配;
如果所述音频帧的声纹与其中一个所述预设声纹匹配,表示所述音频帧的声纹满足预设条件,将所述音频帧识别为所述目标音频帧。
可选的,每个所述预设声纹关联了一个或多个备选显示对象;
所述确定所述目标音频帧对应的用于增强效果的显示对象,包括:
根据与所述目标音频帧的声纹匹配的所述预设声纹,获取所述预设声纹关联的一个或多个所述备选显示对象;
确定其中一个所述备选显示对象为所述目标音频帧对应的所述显示对象。
可选的,所述预设条件包括音频帧的音量超过预设音量;
所述对视频文件或视频流所包含的音频帧进行识别,识别出音量满足预设条件的目标音频帧,包括:
提取所述视频文件或视频流每帧所述音频帧的音量;
判断所述音频帧的音频是否超过所述预设音量;
如果所述音频帧的音量超过所述预设音量,表示所述音频帧的音量满足预设条件,将所述音频帧识别为所述目标音频帧。
可选的,在确定所述目标音频帧所对应用于增强效果的显示对象之前,还包括:对所述目标音频帧进行语音识别,获得语音识别结果;
所述确定所述目标音频帧所对应用于增强效果的显示对象,包括:如果所述语音识别结果表示所述目标音频帧包括语音,以包括文字符的显示对象为所述目标音频帧对应的所述显示对象,所述文字符为所述目标音频帧的语音内容。
可选的,在将所述显示对象添加到所述目标视频帧的图像中之前,还包括:从所述目标视频帧的图像中确定出适于添加所述显示对象的添加位置;
将所述显示对象添加到所述目标视频帧的图像中,包括:将所述显示对象添加到所述目标视频帧的图像中的所述添加位置。
可选的,从所述目标视频帧的图像中确定出适于添加所述显示对象的添加位置,包括:
在所述目标视频帧的图像中进行预设对象识别,获得预设对象识别结果;
基于所述预设对象识别结果,从所述目标视频帧的图像中确定出不包括预设对象的区域;
在所述不包括预设对象的区域中确定出所述添加位置。
可选的,从所述目标视频帧的图像中确定出适于添加所述显示对象的添加位置,包括:
从所述目标视频帧的图像的预设的边缘区域中选择一位置作为所述添加位置。
可选的,在从所述目标视频帧的图像中确定出适于添加所述显示对象的添加位置之后,还包括:
基于所述添加位置,获得所述目标视频帧的图像在所述添加位置处的颜色;
根据所述添加位置处的颜色,将所述显示对象的颜色调整至与所述添加位置处的颜色不同。
第二方面,本发明提供了一种编辑视频的装置,包括:
第一识别模块,用于对视频文件或视频流所包含的音频帧进行识别,识别出音量和/或声纹满足预设条件的目标音频帧,所述视频文件或视频流还包含与每帧音频帧对应的视频帧;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710602551.9/2.html,转载请声明来源钻瓜专利网。