[发明专利]一种对基于鲁棒哈希函数的内容识别进行建模的方法有效
申请号: | 201610029967.1 | 申请日: | 2016-01-18 |
公开(公告)号: | CN105631434B | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 李岳楠 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;H04N21/8549 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 鲁棒哈希 函数 内容 识别 进行 建模 方法 | ||
本发明公开了一种对基于鲁棒哈希函数的内容识别进行建模的方法,所述建模的方法包括以下步骤:将基于鲁棒哈希函数的内容识别等效成在噪声信道上的传输信息,为鲁棒哈希函数建立基于二元对称信道的分析模型;计算所述基于二元对称信道的分析模型中的信道转移概率;计算所述基于二元对称信道的分析模型的容量,利用信息论中的信道编码定理和Fano不等式,获取鲁棒哈希函数在内容识别中的误识别率与参考媒体数目和哈希序列长度之间的关系。根据本发明所提供的建模和分析方法可对鲁棒哈希函数在大规模媒体数据库上的内容识别性能做出预估,可明确鲁棒哈希函数是否可满足实际应用中设定的技术指标,对媒体搜索、索引和拷贝检测等应用具有指导作用。
技术领域
本发明涉及信号与信息处理技术领域,尤其涉及一种对基于鲁棒哈希函数的内容识别进行建模的方法。
背景技术
随着媒体(如图像、音频和视频等)分享网站(如YouTube、优酷等)的普及和快速发展,媒体信息的获取越来越便捷。但是媒体分享网站开放性的特点也带来了版权控制的困难。以视频分享网站为例,任何已注册用户都可以向网站上传视频。然而,有些用户上传的视频可能是受版权保护的内容(如新近发行的影视作品)。如果缺乏有效的版权控制措施,媒体分享网站可能会成为盗版内容传播的平台。为规避这一风险,媒体分享网站需要随时对用户上传内容进行自动检测,判断用户上传内容是否为受版权保护作品的拷贝版本,这一过程被称之为拷贝检测。
多数媒体分享网站采用鲁棒哈希函数作为拷贝检测的主要手段。鲁棒哈希函数是一种将媒体信息(如图像、音频和视频等)转化为内容摘要的映射,所生成的内容摘要(称之为哈希序列)通常为一个简短的二值序列(取值0或1)。这种哈希函数对不影响媒体视听内容的失真(如高质量有损压缩、滤波等)具有鲁棒性,故被称为鲁棒哈希函数。由于鲁棒哈希函数能够简洁且稳定的描述媒体视听内容,在版权控制、媒体搜索和索引等内容识别应用中被广泛采用。图1示例了基于鲁棒哈希函数的内容识别系统。内容识别系统包含一个参考媒体库和哈希数据库。以媒体分享网站中的内容识别系统为例,参考媒体库中存储受版权保护的媒体文件。每个参考媒体在入库的同时由鲁棒哈希函数计算其哈希序列并存储至哈希数据库中,这一过程在离线状态下完成。内容识别为在线环节:当有用户上传媒体时,系统首先计算该媒体(称之为待识别媒体)的哈希序列,并与哈希数据库中所有参考媒体的哈希序列进行比对。对于二值哈希序列,一般采用归一化汉明距作为距离度量准则。若待识别媒体和某一参考媒体之间的哈希序列归一化汉明距小于判决阈值,则判断待识别媒体为该参考媒体的拷贝,系统会终止用户上传或将其内容设置为付费浏览。
文献中已报道的鲁棒哈希函数方面的工作大部分集中在鲁棒哈希函数设计方面,在建模和性能分析方面的工作较少。文献[1]提出一种对旋转和平移等几何失真的图像鲁棒哈希函数,该算法利用傅里叶-梅林变换提取不变特征,之后利用自适应量化器将特征量化至二进制序列。Monga在文献[2]中提出一种基于特征点的鲁棒哈希函数,取特征点响应的量化索引作为二进制哈希。文献[3]中提出的图像鲁棒哈希函数用随机Gabor滤波器提取图像特征,之后对特征矢量进行随机抖动格型矢量量化以生成哈希。文献[4]提出一种基于三维离散余弦变换的视频鲁棒哈希函数,该算法首先对视频做低通滤波、缩放和时域采样等预处理,之后对相邻帧做三维离散余弦变换,在每个变换单元中选取三个低频系数,哈希序列为对所选系数做二值化处理之后的结果。在鲁棒哈希函数性能分析方面:Varna等人以博弈论为基础的研究表明鲁棒哈希函数应保证哈希位以近似相同的概率在0、1间取值,由此可获得尽可能低的误识别率[5]。文献中的工作等以Markov模型为工具对鲁棒哈希函数的碰撞问题进行研究,推导了哈希碰撞概率的解析形式[6]。
发明人在实现本发明的过程中,发现现有技术中至少存在以下缺点和不足:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610029967.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:晶体生长炉具有全行程动平衡的提拉头部件
- 下一篇:光缆连接保护装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法