[发明专利]一种视频处理方法及相关设备有效
| 申请号: | 202010381164.9 | 申请日: | 2020-05-08 |
| 公开(公告)号: | CN111601154B | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 王鑫 | 申请(专利权)人: | 北京金山安全软件有限公司 |
| 主分类号: | H04N21/434 | 分类号: | H04N21/434;H04N21/439;H04N21/488;G10L15/26 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
| 地址: | 100085 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 处理 方法 相关 设备 | ||
1.一种视频处理方法,其特征在于,所述方法应用于电子设备,所述方法包括:
启动语音控制模式,在所述语音控制模式下获取用户输入的语音信息,所述语音控制模式为通过语音控制录制媒体文件的模式;
对所述语音信息进行语音识别得到控制命令;
根据所述控制命令,开始录制媒体文件;
从所述语音控制模式切换到语音录制模式,在录制用于直播的媒体文件时获取所述媒体文件中的音频信息,所述语音录制模式为对所述媒体文件中的音频信息进行语音识别的模式;
识别所述音频信息,获得所述音频信息对应的文字信息;
标记所述文字信息中每个文字的时间点,所述时间点为根据所述音频信息的播放时间确定的,所述时间点用于同步播放所述音频信息和所述文字信息;
将所述文字信息添加到所述媒体文件,播放添加有所述文字信息的媒体文件。
2.如权利要求1所述的方法,其特征在于,所述识别所述音频信息,获得所述音频信息对应的文字信息包括:
向语音服务器发送所述音频信息,以使所述语音服务器识别所述音频信息并生成所述文字信息;
接收所述语音服务器返回的所述文字信息。
3.如权利要求1所述的方法,其特征在于,所述识别所述音频信息,获得所述音频信息对应的文字信息之后,所述方法还包括:
对所述文字信息进行翻译得到翻译文字;
在播放添加有所述文字信息的媒体文件时,显示所述翻译文字和所述文字信息。
4.如权利要求1-3任一项所述的方法,其特征在于,所述播放添加有所述文字信息的媒体文件包括:
根据用户输入的操作指令,调整所述文字信息的显示格式。
5.一种视频处理装置,其特征在于,所述装置包括:
处理模块,用于启动语音控制模式,在所述语音控制模式下获取用户输入的语音信息,所述语音控制模式为通过语音控制录制媒体文件的模式;对所述语音信息进行语音识别得到控制命令;根据所述控制命令,开始录制媒体文件;
获取模块,用于从所述语音控制模式切换到语音录制模式,在录制用于直播的媒体文件时获取所述媒体文件中的音频信息,所述语音录制模式为对所述媒体文件中的音频信息进行语音识别的模式;
所述处理模块,还用于识别所述音频信息,获得所述音频信息对应的文字信息;标记所述文字信息中每个文字的时间点,所述时间点为根据所述音频信息的播放时间确定的,所述时间点用于同步播放所述音频信息和所述文字信息;将所述文字信息添加到所述媒体文件,播放添加有所述文字信息的媒体文件。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
发送模块,用于向语音服务器发送所述音频信息,以使所述语音服务器识别所述音频信息并生成所述文字信息;
接收模块,用于接收所述语音服务器返回的所述文字信息。
7.如权利要求5所述的装置,其特征在于,
所述处理模块,还用于对所述文字信息进行翻译得到翻译文字;在播放添加有所述文字信息的媒体文件时,显示所述翻译文字和所述文字信息。
8.如权利要求5-7任一项所述的装置,其特征在于,所述装置还包括:
所述处理模块,还用于根据用户输入的操作指令,调整所述文字信息的显示格式。
9.一种电子设备,其特征在于,包括:处理器、存储器、通信接口和总线;
所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信;
所述存储器存储可执行程序代码;
所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如权利要求1-4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010381164.9/1.html,转载请声明来源钻瓜专利网。





