[发明专利]面向幻灯片智能截图的翻页误截识别方法有效
申请号: | 202110312746.6 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113205100B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 张晖;叶子皓;赵海涛;孙雁飞;朱洪波 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/50 | 分类号: | G06V10/50;G06V10/75;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 刘莎 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 幻灯片 智能 截图 翻页 识别 方法 | ||
本发明公开了一种面向幻灯片智能截图场景的翻页误截识别方法,包括页面重叠和拼接两种情况的识别方法。识别图像E是否由X、Y重叠而成的步骤包括:利用透明度公式的反推公式计算透明度矩阵A,处理A中的异常值后计算A的均值和方差;根据A的均值和方差判断图像重叠情况。识别图像F是否由图像Z与其他图像拼接而成的步骤包括:在图像Z中选取若干窗口,根据窗口内像素值方差进行筛选,得到待匹配窗口集合{WZ};对{WZ}中的每个窗口都到F中进行图像匹配,去除匹配值过低的窗口对,得到匹配的窗口对集合{(WZ,WF)};根据{(WZ,WF)}计算得到位移向量集合{V};统计{V}中数据得到直方图,根据直方图判断图像拼接情况。
技术领域
本发明涉及图像处理领域,具体涉及一种面向幻灯片智能截图的翻页误截识别方法。
背景技术
在学术研讨会、商务发布会等直播场景中会出现许多与演讲配套的幻灯片,这些幻灯片往往含有巨大的信息量,进而催生了将这些幻灯片截图保存、留档的需求。采用人工截图的方式保存幻灯片页面存在效率低、成本高等问题,因此采用软件自动截图的方式是首选。软件截取幻灯片可以采用画面差异度变化则截图的基本思路,画面差异度指视频中相邻两个关键帧之间的差异程度,当检测到直播画面中画面差异度出现峰值时说明画面发生一次突变对应幻灯片的翻页动作,依次便可进行幻灯片截图。但是采用画面差异度的方式截图会有一些误截问题,主要表现在幻灯片的翻页过程被检测并截取。常见的幻灯片翻页过程包括渐变型和位移型。渐变型翻页时,画面从旧幻灯片逐渐变化为新幻灯片,此时的画面实际上是新旧两张幻灯片的重叠,基于画面差异度的幻灯片检测方法会将这一重叠的图片当作新的幻灯片而检测,称之为重影误截。位移型翻页时,旧幻灯片向某个方向移动同时新幻灯片从画面外移动到画面内,此时的画面实际上是新旧两张幻灯片一部分的拼接,基于画面差异度的幻灯片检测方法同样会将这一拼接的图片当作新的幻灯片而检测,称之为拼接误截。
发明内容
针对上述问题,本发明提供了面向幻灯片智能截图的翻页误截识别方法,其目的在于判断一张图像是否是由其他图像重叠或拼接而来,可以用于判断类似上文中重影误截、拼接误截的问题。
一种面向幻灯片智能截图的翻页误截识别方法,如图3所示,用于对重影误截和拼接误截两种翻页误截情况进行识别,该方法包括:
(一)图像X、E、Y是基于画面差异度从视频中识别并连续截取的三张幻灯片图像,识别图像E是否属于重影误截的具体步骤如下:
步骤1:根据图像X、Y和E,计算透明度矩阵A;
步骤2:将透明度矩阵A中的无穷值inf修改为同符号的图像像素的最大灰度值、非数值NaN修改为其他有限数的均值,得到修改后的矩阵A′;
步骤3:计算A′的均值μ和方差σ2;
其中n为A′的元素总数;
步骤4:若σ2小于预设第一阈值,则图像E是由图像X、Y重叠而成,属于重影误截,且重叠透明度为μ,否则图像E不属于重影误截;
(二)图像Z、F是基于画面差异度从视频中识别并连续截取的两张幻灯片图片,识别图像F是否属于拼接误截的具体步骤如下:
步骤(1):在图像Z中选取若干窗口,得到待匹配窗口集合{WZ};
步骤(2):将{WZ}中每个窗口与F进行匹配,得到匹配窗口对集合{(WZ,WF)};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110312746.6/2.html,转载请声明来源钻瓜专利网。