[发明专利]音频和视频多媒体的修改和呈现在审
| 申请号: | 201980030872.3 | 申请日: | 2019-06-13 |
| 公开(公告)号: | CN112088369A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | T·R·惠特曼;A·鲍格曼;D·巴斯蒂安;N·迈克罗里 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F15/16 | 分类号: | G06F15/16 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘玉洁 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 视频 多媒体 修改 呈现 | ||
1.一种基于音频和视频多媒体部分移除的修改和呈现改进方法,包括:
硬件设备的处理器从本地或远程源接收音频/视频流;
执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测;
处理器针对音频/视频流执行分量分析代码;
处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象从而生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;以及
处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。
2.根据权利要求1所述的方法,其中所述分析音频/视频流的对象包括:
识别对象的主要关注对象;
识别对象的非主要关注对象;
标记主要关注对象和非主要关注对象;以及
基于标记的结果,相对于音频/视频流的各个帧确定主要关注和非主要关注对象之间的交互,其中基于所述交互执行所述移除,并且其中所述移除导致将用户的关注指向所述主要关注对象。
3.根据权利要求2所述的方法,其中确定所述交互包括检测在各个帧内主要关注对象相对于非主要关注对象的运动。
4.根据权利要求1所述的方法,其中所述对象包括视频对象。
5.根据权利要求1所述的方法,其中所述对象包括音频对象。
6.根据权利要求1所述的方法,其中所述对象包括视频对象和相关的音频对象。
7.根据权利要求1所述的方法,还包括:
处理器在远程数据库中存储修改后的音频/视频流。
8.根据权利要求1所述的方法,其中,针对音频/视频流执行所述分量分析代码导致根据指定的时间段针对音频/视频流的各个帧解析每个所述对象。
9.根据权利要求1所述的方法,还包括:
处理器响应于分量分析代码的执行确定所述对象的附加对象比所述对象更位于所述GUI内的中央,其中,所述移除还基于所述确定的结果。
10.根据权利要求1所述的方法,针对音频/视频流执行分量分析代码:
确定主要关注对象;
识别非主要关注对象;
确定主要关注对象与非主要关注对象之间的交互;以及
基于对主要关注对象的变化,预测对非主要关注对象的变化。
11.根据权利要求1所述的方法,还包括:
处理器从本地或远程源检索音频/视频流的其他视图;
处理器响应于分量分析代码的执行向修改后的音频/视频流添加一个附加对象;以及
处理器和通过GUI呈现包括附加对象的修改的音频/视频流。
12.根据权利要求1所述的方法,还包括:
为在控制硬件中创建、集成、托管、维护和部署计算机可读代码中的至少一项提供至少一种支持服务,所述代码由计算机处理器执行以实现:所述接收、所述分析、所述执行、所述移除和所述呈现。
13.一种计算机程序产品,包括存储计算机可读程序代码的计算机可读硬件存储设备,计算机可读程序代码包括算法,在由硬件设备的处理器执行时实现基于音频和视频多媒体部分移除的修改和呈现改进方法,方法包括:
硬件设备的处理器从本地或远程源接收音频/视频流;
执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测;
处理器针对音频/视频流执行分量分析代码;
处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象从而生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;以及
处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980030872.3/1.html,转载请声明来源钻瓜专利网。





