[发明专利]音频和视频多媒体的修改和呈现在审
| 申请号: | 201980030872.3 | 申请日: | 2019-06-13 |
| 公开(公告)号: | CN112088369A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | T·R·惠特曼;A·鲍格曼;D·巴斯蒂安;N·迈克罗里 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F15/16 | 分类号: | G06F15/16 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘玉洁 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 视频 多媒体 修改 呈现 | ||
提供了一种用于改进音频和视频多媒体修改和呈现的方法和系统。方法包括:接收音频/视频流;以及分析音频/视频流的对象,以针对对象生成预测。针对音频/视频流执行组件分析代码,并且从音频/视频流中移除对象从而生成修改后的音频/视频流,从而减少了音频/视频流的硬件存储和传输大小要求。修改的音频/视频流通过图形用户界面呈现给用户。
技术领域
本发明总体上涉及一种用于修改音频和视频多媒体的方法,尤其涉及一种用于改进与从音频/视频流中移除对象的硬件设备相关联的音频和视频多媒体技术的方法和相关系统,从而减少了音频/视频流的硬件存储和传输大小要求。
背景技术
通常在给定的一天中观看多个小时的广播视频流与众所周知的过程相关联。同样,移动设备市场的增长与互联网对移动设备的当前访问可用性相结合,使得可以在任何时间,任何位置轻松访问多媒体内容。当前的预测估计,未来多媒体内容的水平将增长到数百万兆兆字节。当前存在关于减小多媒体的大小以解决传输的大量数据的大量解决方案。与基于整个视觉场景中的对象运动确定的捕获或帧速率相关的过程可能会导致使用较少的带宽。在多媒体数据传输期间分配网络资源或压缩图像可以实现视频信号的更快传输。类似地,用于检测运动图像中的像素的过程可以使用户能够查看某些对象。
然而,前述解决方案可能需要使用不准确且复杂的系统来传输多媒体流。另外,前述解决方案可能导致较慢的数据传输速率。结果,当前的解决方案不包括减小传输大小要求的有效手段。
因此,在本领域中需要实现一种用于发送多媒体内容的有效手段。
发明内容
本发明的第一方面提供了一种基于音频和视频多媒体部分移除的修改和呈现改进方法,包括:硬件设备的处理器从本地或远程源接收音频/视频流;执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测,从而通过检测主要关注对象相对于非主要关注对象的运动来标识和标记主要和非主要关注对象并确定相关联的交互;处理器针对音频/视频流执行分量分析代码,从而导致根据指定时间段针对音频/视频流的各个帧解析每个对象的过程,从而基于主要关注对象的改变来预测非主要关注对象的改变;处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象,从而导致生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;和处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。
本发明的一些实施例还提供了一种用于:确定附加对象比原始对象更位于GUI内的中央;检索音频/视频流的其他视图;向修改后的音频/视频流添加一个附加对象;和通过GUI呈现包括附加对象的修改的音频/视频流。这些实施例有利地提供了一种有效的手段,用于基于图像内音频/视频对象之间的交互来隔离音频和视频馈送的主要成分,以针对(在多媒体流内)视觉核心动作集中用户的注意力。另外,本发明的这些实施例有利地使得能够基于音频/视频对象运动来实现语义修剪过程,并且可以被配置通过平滑相邻像素使用户专注于每个音频/视频帧内的高潮动作而不是围绕核心对象的多余对象来减小多媒体流的大小。
本发明的第二方面提供了一种计算机程序产品,包括存储计算机可读程序代码的计算机可读硬件存储设备,计算机可读程序代码包括算法,在由硬件设备的处理器执行时实现基于音频和视频多媒体部分移除的修改和呈现改进方法,方法包括:硬件设备的处理器从本地或远程源接收音频/视频流;执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测,从而通过检测主要关注对象相对于非主要关注对象的运动来标识和标记主要和非主要关注对象并确定相关联的交互;处理器针对音频/视频流执行分量分析代码,从而导致根据指定时间段针对音频/视频流的各个帧解析每个对象的过程,从而基于主要关注对象的改变来预测非主要关注对象的改变;处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象,从而导致生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;和处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980030872.3/2.html,转载请声明来源钻瓜专利网。





