[发明专利]一种基于视频的审判员打电话行为识别方法在审
申请号: | 201711168589.6 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107832728A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 朱健立;于宏志;王景彬;刘永乐 | 申请(专利权)人: | 天津英田视讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 天津滨海科纬知识产权代理有限公司12211 | 代理人: | 杨慧玲 |
地址: | 300384 天津市滨海新区高新区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 审判员 打电话 行为 识别 方法 | ||
技术领域
本发明属于视频检测技术领域,尤其是涉及一种基于视频的审判员打电话行为识别方法。
背景技术
开庭过程中,法官接打电话既是自身专业性不强的表现又对法庭的严肃性造成了破坏,甚至有可能通过电话影响审判的公正性。法官应该严格遵守“禁止开庭期间打私人电话”的法庭纪律。随着法庭电子化升级的进行,现在绝大多数法庭利用摄像设备来记录庭审过程。在有了高清庭审视频后,使用计算机代替人进行打电话识别成为了可能。
发明内容
有鉴于此,本发明旨在提出一种基于视频的审判员打电话行为识别方法,以利用高清庭审视频,自动找到法官位置,进行打电话识别。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于视频的审判员打电话行为识别方法,具体包括如下步骤:
(1)利用人物头肩的纹理特征识别出图像中感兴趣区域中的人物头肩区域;
(2)利用深度学习分类模型对人物头肩区域进行识别,判断当前图像是否存在打电话行为;
(3)根据判断结果计算打电话能量,并进行最终判断。
进一步的,所述步骤(1)中具体包括,建立人物头肩样本库,根据已知人物头肩样本的HOG特征,利用DPM算法建立人物头肩模型,然后在待检测视频的感兴趣区域使用头肩模型进行检测,得到视频中人物的头肩范围。
进一步的,所述步骤(2)中具体包括,建立打电话和未打电话样本库,利用样本库使用深度学习进行分类模型训练,将人物的头肩范围图像通过深度学习进行识别,判断当前图像是否存在打电话行为。
进一步的,所述步骤(3)中具体包括,根据多次判断结果对人物目标进行能量得分积累,然后根据能量得分最终对人物是否在打电话进行判断。
进一步的,所述利用DPM算法建立人物头肩模型具体包括
(11)DPM算法首先将待检图像进行分块,然后对每个块提取HOG特征;
(12)计算各个区块到中心的距离来得到各个区块的权重,将这些带权重的HOG特征通过SVM级联分类器进行训练和检测,最终得到人物头肩区域位置。
相对于现有技术,本发明所述的一种基于视频的审判员打电话行为识别方法具有以下优势:本发明利用高清庭审视频,自动找到法官位置,然后进行打电话识别;本发明由于使用了能量累积的思想,具有正确率高、漏检率低和鲁棒性强的特性。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述的一种基于视频的审判员打电话行为识别方法流程图;
图2为本发明实施例所述的HOG特征提取框图;
图3为本发明实施例所述的矩形HOG块的划分示意图;
图4为本发明实施例所述的DPM流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
本发明提供了一种基于视频的审判员打电话行为识别方法,本发明的整体流程图如图1所示,主要步骤如下:
一、在图像中找到人物头肩区域,本发明中使用DPM算法进行人物头肩模型的训练和检测。
1.DPM算法首先将待检图像进行分块,然后对每个块提取HOG特征,梯度方向直方图(Histogram of Oriented Gradient,HOG)特征是一种在计算机视觉和图像处理领域常用的特征描述方法,其提取特征过程如图2所示:
(1)将图像归一化:
其中max和min分别为图像最大和最小像素值,x为归一化前像素值,x* 为归一化后的像素值。
(2)利用一阶微分计算归一化图像的梯度。
i,j为当前像素的坐标,表示梯度,每个点对应8个梯度值。
(3)基于梯度幅值的方向权重投影。如图3所示,矩形HOG块的划分一个块(Block)由4个单元(Cell)组成,一个单元由64个像素点组成。将 0~180度分布平均分成9个方向角度,每个方向角度范围都会对应一个Bin,将步骤(2)中获得的梯度在每个Cell中独立做梯度方向统计,得到一个9 维向量v(x1,x2,…,x9),其中x1对应投影到0~20度方向bin中梯度的个数,对于每个Block来说,得到36维度特征向量v(x1,x2,…,x36)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津英田视讯科技有限公司,未经天津英田视讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711168589.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种室内商场店铺特征提取方法
- 下一篇:一种基于云计算的大数据文本分类方法