[发明专利]一种基于内容计算的音频标签传播方法无效
申请号: | 201110197940.0 | 申请日: | 2011-07-15 |
公开(公告)号: | CN102262659A | 公开(公告)日: | 2011-11-30 |
发明(设计)人: | 蔡晶;郎波;李未 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 李新华 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 内容 计算 音频 标签 传播 方法 | ||
技术领域
本发明为利用分析音频内容得到的音频相似性来自动为音乐数据集中未标注音乐标签进行标注。
背景技术
随着互联网上数字音乐的爆炸式增长,音乐标签的重要性越来越突出。音乐标签一般是对音乐语义进行描述的短文本,其在音乐的检索、管理与推荐中非常有用。
然而,当前面临的问题是如何高效地获取准确的音乐标注。现阶段能获取音乐标注的方法可以归纳为:1、专家标注;2、分类模型训练;3、社会化标注。但是这些方法都有其优劣:专家标注能获得准确的标签,但其标注成本巨大且所获得的语义信息不够丰富;分类模型的训练虽然是自动化方法,但现阶段其标注准确率使其还不能进行推广;而社会化标注能够获得较为准确且丰富的标注,并且成本低廉,但其存在大量噪音和长尾效应。
如何能在标注成本、效率、准确性与丰富程度,减少长尾效应上寻求平衡,帮助用户自动获取到音乐的标注具有重要意义。
发明内容
本发明要解决的问题:通过对音乐内容分析相似计算,进行现有标签的传播,在较好的标注准确性基础上自动获取未标注音乐的标签,减轻了人工标注的工作。
本发明采用的技术方案:一种基于内容计算的音频标签传播方法描述如下:
(1)基于密度的标签传播:基于内容相似计算出音频的相似矩阵,构建音乐网络,扫描所有未标注音乐,当距离某个未标注音乐α的相似距离不超过L,且最多m个最邻近音乐上标注率达到P1时,如果某个标签τ的出现率达到P3,则将标签τ传播给α。该独立过程被称作基于密度的标签传播模型。
(2)基于概率的标签传播:对于全体音乐集中的已标注音乐部分集,计算出n*pn率,其中pn即percision at n,为某已标注音乐的n个最近邻居音乐与其具备相同标签的平均准确率,n∈N,N为自然数,n*pn表示某音乐的邻近音乐中与其具有相同标签的音乐个数期望,并将其近似为全体集的n*pn,根据所述期望,计算出某个已标注音乐周围的相似音乐与其具有相同标签概率,据此传播标签;此独立的过程被称作基于概率的标签传播模型;
(3)基于上述步骤(1)和(2)分别进行标签传播后,求出传播结果的交集,并将其作为已标注音乐,利用上述步骤(1)或(2)重新进行一次传播。
所述的步骤(3)进一步包括:
(3a)参数L的取值为,在所有音乐中最近的第m个邻居距离与最远的第m个邻居距离之间min{dim|i∈任意未标注音乐}<L<max{dim|i∈任意未标注音乐},其中,dim代表某未标注音乐i与第m个邻居的距离。
经过实验,利用两种模型的混合的传播方式,在对未标注音乐有相同召回率情况下,比使用任何一种单独的模型有更高的准确率,基于概率的传播准确率比基于密度的传播准确率略差。
附图说明
图1为基于标签密度的传播模型示意图;
图2为密度传播模型中距离阈值N取值对准确率影响曲线;
图3为基于标签密度与标签概率模型传播空间对比;
图4为本发明的总体流程图;
图5为基于标签概率传播模型流程图;
图6为基于标签密度传播模型流程图;
具体实施方式:
本发明的具体实施方式如下:
(1)输入数据为一个音频数据集,其中某些音乐带有外部标签,称其为“已标注音乐”,余下的为“未标注音乐”。提取出所有音频的20个MFCC特征,并利用单高斯方法对每个音频进行建模。再利用(Kullback-Leibler Divergence)即KL距离计算出两两音频之间的相似程度。所有音频的相似程度形成了一个相似矩阵,单元格[i,j]表示音乐i与音乐j之间的相似性。
(2)基于密度的传播模型:根据相似矩阵,所有音乐形成了一个关联的网络,越相似越接近,如附图1。接着,扫描所有的未标注音乐,当距离某个未标注音乐α相似距离不超过L,且最多m个最邻近音乐上标注率达到P1时,如果某个标签τ的出现率达到P3,则将标签τ传播给α。也就是α被标注上了标签τ,该次传播的标签称为“被传播标签”。在该过程中,被传播标签不能参与再次传播。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110197940.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:背侧照明的图像传感器
- 下一篇:一种用于数控系统中双环现场总线的安全通信方法
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法