[发明专利]一种视频卡顿识别方法、装置及终端设备在审
| 申请号: | 202010087225.0 | 申请日: | 2020-02-11 |
| 公开(公告)号: | CN111339842A | 公开(公告)日: | 2020-06-26 |
| 发明(设计)人: | 胡甜敏 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频卡 识别 方法 装置 终端设备 | ||
本申请提供了一种视频卡顿识别方法、装置及终端设备,适用于视频处理技术领域,该方法包括:当视频监控状态为第一状态且视频中存在人脸时,将监控状态修改为第二状态;若为第二状态,对视频采样得到N张第一帧图像;若N张第一帧图像之间的图像差异度小于第一差异阈值,将最早的采样时刻作为卡顿起始时刻,并将监控状态设置为第三状态;若监控状态为第三状态,对视频采样得到M张第二帧图像;若M张第二帧图像之间的图像差异度大于或等于第一差异阈值,将最晚的采样时刻作为视频的卡顿终止时刻,将监控状态设置为第一状态,并识别视频的卡顿时间段。本申请实施例实现了对卡顿开始和结束的精确识别,从而实现了对卡顿时间段的精确识别。
技术领域
本申请属于视频处理技术领域,尤其涉及视频卡顿识别方法及终端设备。
背景技术
随着技术的不断进步,通过网络进行视频通话(以下简称通话)已经成为了生活和工作中常见的一幕场景,由于实时通话的效果会受到实时网络状态、视频设备状态和视频服务器资源等的影响,其中只要任意一环出现问题都有可能导致通话过程中出现视频卡顿。为了改善卡顿的情况,首先需要确定出通话过程中具体何时出现了卡顿,再对卡顿时的各环节情况进行分析进而定位出卡顿原因,以精确改善视频卡顿情况。
现有技术中都是由测试人员手动对通话录制的视频文件进行查阅,并确定出其中存在卡顿的时段,然而这样识别的效率极为低下。
发明内容
有鉴于此,本申请实施例提供了一种视频卡顿识别方法及终端设备,可以解决对视频通话卡顿识别效率低下的问题。
本申请实施例的第一方面提供了一种视频卡顿识别方法,包括:
当实时通话过程中的视频对应的监控状态为第一状态时,对所述视频进行人脸检测,并在检测到所述视频中存在人脸时,将所述视频对应的监控状态修改为第二状态;
若所述监控状态为第二状态,以第一频率对所述视频进行采样得到N张第一帧图像,并对N张所述第一帧图像进行比对,其中,N为大于1的正整数;
若比对结果为N张所述第一帧图像之间的图像差异度小于第一差异阈值,将各张所述第一帧图像对应的采样时刻中最早的采样时刻,作为所述视频的卡顿起始时刻,并将所述监控状态设置为第三状态;
若所述监控状态为第三状态,以第二频率对所述视频进行采样得到M张第二帧图像,并对M张所述第二帧图像进行比对,其中,M为大于1的正整数;
若比对结果为M张所述第二帧图像之间的图像差异度大于或等于所述第一差异阈值,将各张所述第二帧图像对应的采样时刻中最晚的采样时刻,作为所述视频的卡顿终止时刻,将所述监控状态设置为第一状态,并基于所述卡顿起始时刻和所述卡顿终止时刻识别所述视频的卡顿时间段。
在第一方面的第一种可能的实现方式中,所述对N张所述第一帧图像进行比对,包括:
针对每张所述第一帧图像进行人脸器官坐标分析,得到N个第一人脸器官坐标集;
利用N个所述第一人脸器官坐标集对N个所述第一帧图像进行比对。
在第一种可能实现方式的基础上,在第一方面的第二种可能的实现方式中,所述第一人脸器官坐标集为多个坐标组的集合,每个坐标组对应一种人脸器官,且每个坐标组中包含对应的人脸器官的多个坐标;
所述针对每张所述第一帧图像进行人脸器官坐标分析,包括:
将待分析的所述第一帧图像作为目标图像,对所述目标图像进行人脸轮廓绘制,得到对应的人脸轮廓图形;
获取各个人脸器官在所述人脸轮廓图形中的第一相对位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087225.0/2.html,转载请声明来源钻瓜专利网。





