[发明专利]一种智能识别视频中的特殊区域的方法及装置在审
| 申请号: | 201810967841.8 | 申请日: | 2018-08-23 |
| 公开(公告)号: | CN109241885A | 公开(公告)日: | 2019-01-18 |
| 发明(设计)人: | 郭增洁 | 申请(专利权)人: | 无锡天脉聚源传媒科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32 |
| 代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 段玉华 |
| 地址: | 214000 江苏省无锡*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频帧 智能识别 视频 简化处理 模型处理 文本信息 运算量 采样 预设 图像 | ||
本发明公开了一种智能识别视频中的特殊区域的方法及装置。所述智能识别视频中的特殊区域的方法,包括:将采样得到的视频帧进行简化处理,确认经过简化处理的视频帧为待处理视频帧;使用预设的智能识别模型处理所述待处理视频帧,识别出所述待处理视频帧的特殊区域;确认所述待处理视频帧的特殊区域为所述视频的特殊区域。本发明可以通过较低的运算量在较短的时间内识别出视频中的特殊区域,为后续的提取特殊区域的图像中的文本信息提供了可靠的保障。
技术领域
本发明涉及图像智能处理技术领域,特别涉及一种智能识别视频中的特殊区域的方法及装置。
背景技术
视频,尤其是视频直播,已经广泛的扎根于网络时代的人们的日常生活中。某些视频直播的特殊区域,例如足球比赛视频直播的分数牌,再例如短跑比赛视频直播的计时牌,再例如刀塔比赛视频直播的击杀助攻伤害统计区域,上述这些特殊区域是具有巨大的实际意义的,计算机若可实时准确的获取到视频直播中的特殊区域将为后续的智能信息服务提供可靠的保障。但是由于视频直播的特性,使用现有的图像特征分析的技术,在视频直播中识别出特定区域所需要的运算量是非常巨大的,难以满足在较短识别时间内达到较高识别成功率的需求。如何妥善的处理上述问题,就成为了业界亟待解决的课题。
发明内容
本发明提供一种智能识别视频中的特殊区域的方法及装置,用以通过较低的运算量在较短的时间内识别出视频中的特殊区域。
根据本发明实施例的第一方面,提供一种智能识别视频中的特殊区域的方法,包括:
将采样得到的视频帧进行简化处理,确认经过简化处理的视频帧为待处理视频帧;
使用预设的智能识别模型处理所述待处理视频帧,识别出所述待处理视频帧的特殊区域;
确认所述待处理视频帧的特殊区域为所述视频的特殊区域。
在一个实施例中,还包括:
在采样之前,对所述预设的智能识别模型进行训练。
在一个实施例中,所述将采样得到的视频帧进行简化处理,确认经过简化处理的视频帧为待处理视频帧,包括:
每间隔a帧提取出1帧视频帧,确认提取出的视频帧的集合为所述采样得到的视频帧;
将所述采样得到的视频帧的分辨率设置为预设的第一分辨率,所述预设的第一分辨率小于所述采样得到的视频帧的分辨率,且所述预设的第一分辨率与所述采样得到的视频帧的分辨率的横竖像素值的等比例;
计算出所述视频帧的所有像素点的rbg三个通道的数值的平均值;
计算出所述视频帧的各个像素点的rbg三个通道的数值与所述平均值的差值,确认所述视频帧的各个像素点的像素值为对应的所述差值。
在一个实施例中,所述使用预设的智能识别模型处理所述待处理视频帧,识别出所述待处理视频帧的特殊区域,包括:
通过所述预设的智能识别模型识别出所述待处理视频帧的类型;
根据所述类型对应的特殊区域的位置信息,来识别出所述待处理视频帧的特殊区域。
在一个实施例中,所述对所述预设的智能识别模型进行训练,包括:
获取至少两个类型的视频帧,其中,各个类型的视频帧的数量均大于3;
在各个视频帧中预先标记出各自类型对应的特殊区域的位置,所述特殊区域的位置包括顶点坐标值和长宽比;
降低模型的参数中的学习率,所述模型为原始模型进行初步训练后得到的二次模型。
根据本发明实施例的第二方面,提供一种智能识别视频中的特殊区域的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡天脉聚源传媒科技有限公司,未经无锡天脉聚源传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810967841.8/2.html,转载请声明来源钻瓜专利网。





