[发明专利]一种基于GLR的同源音频广告检索方法在审
申请号: | 201510129997.5 | 申请日: | 2015-03-23 |
公开(公告)号: | CN104731913A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 杨继臣;金海 | 申请(专利权)人: | 华南理工大学;广州荔支网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L25/54 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 glr 同源 音频 广告 检索 方法 | ||
1.一种基于GLR的同源音频广告检索方法,其特征在于,包括以下步骤:
步骤1、为音频文件的特征构建数据窗;从音频文件的特征开始选择一段和同源音频广告的特征长度相同的数据窗,然后在音频文件上以1秒为单位选择同样大小的数据窗,直至音频文件的特征结束;
步骤2、为数据窗和音频广告构建模型;首先合并数据窗和音频广告形成大数据窗,其次对数据窗、音频广告和大数据窗分别构建数据模型:所述数据模型存在两种假设:第一种假设:假设数据窗和音频广告分别属于两种不同的单一高斯分布,第二种假设:假设大数据窗属于同一种单一高斯分布;
步骤3、计算步骤2中所假设的两种假设数据模型的GLR值,通过在音频文件上滑动选择数据窗,计算一系列的GLR值;
步骤4、根据GLR值,在音频文件上获得音频广告的位置。
2.根据权利要求1所述的基于GLR的同源音频广告检索方法,其特征在于,在步骤1中,构建数据窗的构建方法为:首先为音频广告和音频文件分别提取梅尔倒谱系数,为音频文件的特征划分数据窗,划分的方法是每次选取的数据窗的长度和音频广告的特征的长度是一样,然后以1秒为单位滑动选择数据窗,直至结束。
3.根据权利要求1所述的基于GLR的同源音频广告检索方法,其特征在于,在步骤2中,所述数据窗和音频广告的模型的构建方法为:首先合并数据窗和音频广告,称为大数据窗,其次分别对数据窗音频广告和大数据窗构建数据模型,所述数据模型有两种假设:第一种假设:假设数据窗和音频广告的特征数据分别属于两种不同的单一高斯分布,第二种假设:假设大数据窗的特征数据属于同一种单一高斯分布,假设数据窗的和音频广告的特征数目为N
WIN:f
ADV:f
BWIN:f
其中,∑
4.根据权利要求3所述的基于GLR的同源音频广告检索方法,其特征在于,在步骤4中,所述GLR值的计算公式为:
G(i)=2N
其中,
其中,L
5.根据权利要求1所述的基于GLR的同源音频广告检索方法,其特征在于,所述音频广告的位置的获得方法为:如果某个时间点是音频广告的位置,则该时间点的音频广告位置的GLR值必须满足:不仅要小于前面一个还要小于后面一个而且这几个都要小于一个实验最优值,判决公式为:
其中,G(i-1)、G(i)和G(i+1)分别表示为第i-1、第i和第i+1个GLR值,Th表示实验最优值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州荔支网络技术有限公司,未经华南理工大学;广州荔支网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510129997.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于本体的资源发现系统及方法
- 下一篇:一种ETL中海量数据抽取的方法