[发明专利]一种通过识别音频指纹以去除广告的方法在审
| 申请号: | 201610566899.2 | 申请日: | 2016-07-19 |
| 公开(公告)号: | CN107633848A | 公开(公告)日: | 2018-01-26 |
| 发明(设计)人: | 石钰;胡蓓蓓;岳传真;李杨;虞逸斐 | 申请(专利权)人: | 阿基米德(上海)传媒有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L17/00;G06Q30/02 |
| 代理公司: | 上海金盛协力知识产权代理有限公司31242 | 代理人: | 郑鸣捷 |
| 地址: | 200051 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 通过 识别 音频 指纹 去除 广告 方法 | ||
技术领域
本发明涉及一种通过识别音频指纹以去除广告的方法。
背景技术
随着广播技术的发展,越来越多用户可以通过终端设备点播音频进行观看。在现有技术中,音频广播经常植入一段或者多段广告。比较常见的是在正式广播前插入广告,让用户在收听广播时必须先听一下广告。用户在进行音频文件下载时,也会下载到音频集合中的广告音频段,播放时也需要播放广告音频,给用户收听音频造成不好的体验。
已知的技术例如一种基于音频指纹的两层广告音频检索方法(公开号CN104317967,如图1所示),其先是基于音频的频谱幅度特征,提取两种不同维度的音频指纹,再基于两种音频指纹进行两层检索。现有技术给出了一种广告音频的检索方法,但没有给出在此基础上如何去除广告的方法。
已知的技术例如一种广告视频的检测方法(公开号CN101080028A),其中提出了同时利用广告视频具有的图像和音频特征综合进行检测,但这种方式对于只有音频的广播没有直接效果,同时也没有进一步提供去除广告的功能。
因此,现有技术主要存在以下缺点:现有音频领域技术在主要针对广告的识别,但是却没有广告的去除,但是在广播节目中为了提高用户体验仅仅是识别出广告是不够的;现有的去广告技术主要实在视频领域,再音频领域目前还是空白,而视频和音频在处理方法上是有各自特点,不能完全通用;现有的音频声纹识别,主要是针对某种音频格式进行,并不具有格式的普适性。综合以上三点,现有技术在音频去广告这个领域是无法满足现有需要的,而且具有局限性,使得在使用上和用户体验上,都不能带来较理想的效果。
发明内容
为了使用户有更好的音频听收体验,在回听前,需要将音频文件中的广告音频从音频文件集合中寻找出来进行删除,这样再次收听时,就可以收听没有广告的音频。但是,由于广告音频和普通音频在文件名称等属性上无法被分辨出来,所以如何识别广告音频是一个急需解决的技术问题。
本发明提供一种通过识别音频指纹以去除广告的方法,其特征在于,包括如下步骤:提取原始音频数据中的广告的指纹特征信息,并将该音频指纹添加到音频广告特征指纹库;在回听原始音频数据时,将原始音频数据中与音频广告特征指纹库中的信息相同的部分滤除,进而播放去除广告的音频。
优选地,所述提取的方法进一步包括首先对广告音频片段采用ffmpeg解码,ffmpeg支持解码的音频格式都可以采用本发明进行处理;将解码后的数据,进行子带分解,获得从低到高8个子带分离后的信号;然后检测各个子带的信号的onset个数,并记录下检测到onset的时刻。
优选地,在获得了各个子带onset的个数以及时刻后,分别取每个子带相邻的的4个onset,计算彼此的时刻差,并将计算生成的时刻差的组合以及onset所在的子带编号,进行联合哈希编码,并与参与编码中的首个onset所在的时刻,同时存储。
优选地,对声纹码进行解析,获得各个子带上的onset时间差值,并与库中存储的声纹特征进行查找匹配,找到吻合样本最高的广告片段,如果仅有一个广告匹配成功则检测结束;否则,将进行第二轮onset时刻的检索,找到onset时刻最匹配的广告,两轮匹配后找到匹配度最高的广告,并将匹配时刻记录下来,这样就获得了音频中广告的时刻,可以因此定位,将广告剔除。
不管广播的直播内容还是下载的回听内容都包括了大量的用户不愿意听到的广告信息,通过本方案技术可以将回听的广播音频中的广告内容去除,以使用户收听到真正要听到的广播音频内容,使得用户收听更专注,体验更好。同时本方案结合了ffmpeg的音频解码器,可以适用于大多数的音频格式,而不仅仅局限于单一的格式。
附图说明
图1是现有技术中已知的检索广告的示意图;
图2是通过识别音频指纹以去除广告的示意图。
具体实施方式
在广播领域,音频直播过程中会加入一些广告信息,但是当下载了回听的音频,可以根据音频广告指纹信息,按照鲁棒性的原则对音频进行检索并去除广告,而不影响音频的正常播放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿基米德(上海)传媒有限公司,未经阿基米德(上海)传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610566899.2/2.html,转载请声明来源钻瓜专利网。





