[发明专利]一种用于提取关键帧的多媒体系统及处理方法有效
| 申请号: | 201410737503.7 | 申请日: | 2014-12-05 |
| 公开(公告)号: | CN104391973A | 公开(公告)日: | 2015-03-04 |
| 发明(设计)人: | 张耀坤;苏丹;秦衡;谢清玉;蒋同军 | 申请(专利权)人: | 国家电网公司;国网技术学院 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N5/76 |
| 代理公司: | 北京青松知识产权代理事务所(特殊普通合伙) 11384 | 代理人: | 郑青松 |
| 地址: | 100031 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 提取 关键 多媒体 系统 处理 方法 | ||
技术领域
本发明涉及多媒体领域,特别涉及能够进行关键帧提取的多媒体领域。
背景技术
随着网络和多媒体技术的广泛应用,网络培训已成为员工培训的必然发展趋势。然而,网络培训面临着“来源单一、脱离实践、滞后现场”的问题,尤其是缺少以现场案例为内容的生产技能类培训,这势必会影响以生产技能操作为主的员工培训效果。因此,积极引入现场案例教学,探索智能终端和移动网络的应用,将成为网络培训和资源建设的新方向。
发明内容
本发明涉及一种多媒体系统,包括拍摄终端、服务器和查询终端;其特征在于:服务器包括第二传输单元、解析单元、数据库、第二存储单元;查询终端包括第三摄像单元、第三输入单元、查询单元、第三传输单元;其中,解析单元用于从多媒体的视频中提取关键帧。
本发明还涉及一种使用所述多媒体系统的多媒体处理方法,其特征在于包括以下步骤:
步骤S100,用户使用拍摄终端拍摄多媒体,所述多媒体包括视频和音频;当在某一位置和/或变焦拍摄时,由计时单元记录下拍摄的开始时间和结束时间;随后,计时单元将事件、开始时间和结束时间一并保存到第一存储单元的记录表中,其中所述事件包括位置、变焦;
步骤S200,将多媒体中的音频转换为文字,转换后,在拍摄终端上显示给用户,供用户确认;如果用户认为转换的文字内容有错误或需要调整,则使用拍摄终端的第一输入单元进行修改;
步骤S220,拍摄终端通过第一传输单元将拍摄的多媒体、第一存储单元中的记录表、以及经过用户确认的文字上传到服务器的第二传输单元,服务器将拍摄的多媒体保存到数据库中,并记录多媒体ID,所述多媒体ID是上传的多媒体的唯一标识;
步骤S240,服务器根据记录表中的事件、开始时间和结束时间,使用解析单元从多媒体的视频中提取关键帧,并确定关键帧的录制时长,所述关键帧为拍摄终端在同一事件下拍摄的视频帧的代表;提取关键帧的具体过程如下:
对于每个事件,进行采样,从而获得每个事件的采样帧的集合F:
F={F1,F2,……Fi,……Fn}
其中,n为定义的采样频率,n=10;
Fi为采样的第i帧,即时间ΔTi所对应的帧:
ΔTi=Tb+(Te–Tb)*(i/n),i<=n
其中,Tb为每个事件的开始时间,Te为每个事件的结束时间;
对于集合F内的某一帧Fk,根据以下公式计算帧Fk与视频帧平均值的平均像素近似度ΔFk:
其中Pkj表示帧Fk中的第j个像素值,Pij表示帧Fi中的第j个像素值,n为采样频率,m为帧Fk中的像素总数,k的取值为1,2,3......n;
如果ΔFk大于某个阈值D,则认为帧Fk属于噪声帧,予以剔除;反之如果ΔFk小于或等于某个阈值D,则予以保留,从而形成保留帧的集合G:
G={G1,G2,…Gi,…Gt}
其中t<=n,Gi为保留帧集合中的第i帧;
对于集合G中的每一帧,由于其内容都比较相似,故可任选一帧作为相应事件所对应的关键帧;
步骤S260,得到视频中每个事件对应的关键帧和事件的持续时间,其中根据每个事件的开始时间和结束时间获取持续时间;
步骤S300,服务器从上传的文字中提取文字索引;对于每一个多媒体,服务器形成多媒体索引表,并存储在第二存储单元中;所述多媒体索引表包括:多媒体ID、文字索引、关键帧集合以及事件持续时间集合;
步骤S400,用户使用查询终端查找所述多媒体,并将检索结果呈现给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网技术学院,未经国家电网公司;国网技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410737503.7/2.html,转载请声明来源钻瓜专利网。





