[发明专利]用于音频帧处理的设备和方法在审
申请号: | 201710951055.4 | 申请日: | 2017-10-12 |
公开(公告)号: | CN107945816A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 菲利普·吉尔贝东;斯尔丹·基蒂奇 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L15/08;G10L19/26 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 潘剑颖 |
地址: | 法国伊西*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 处理 设备 方法 | ||
技术领域
本公开总体涉及音频识别,特别地涉及音频识别特征的计算。
背景技术
本部分是为了向读者介绍可能与下文所述的和/或所要求保护的本公开各个方面相关的现有技术的各方面。相信该讨论有助于向读者提供背景信息以便于更好地理解本公开的各个方面。因此,应当理解:这些陈述应按这种方式解读,而不是作为对现有技术的承认。
音频(声学的,声音)识别由于其是相对非侵入性的而特别适用于监测人类活动,不需要除了麦克风之外的其它检测器,并且是相对精确的。然而,为了成功经常需要密集的计算操作,这也是一项具有挑战性的任务。
图1示出了一般常规的音频分类处理流程100,所述音频分类处理流程100包括:音频传感器110,捕获原始音频信号;预处理模块120,为特征提取模块130准备所捕获到的音频;特征提取模块130,向分类器模块140输出所提取到的特征(即,标志系数);分类器模块140,使用音频数据库150中的条目来标记随后被输出的音频。
用户接受音频识别的主要约束是保护隐私。因此,音频处理应当优选地在本地执行,而不是使用云服务。因此,CPU消耗和在某些情况下的电池寿命可能是在便携式设备中部署此类服务的严重限制。
相反的约束是技术性的:许多不同的音频事件具有非常相似的特性,这些特性需要繁琐的处理能力来提取使得能够区分这些音频事件的特征。可以通过利用音频信号的精细时频特性来增强识别,然而,这增加了计算成本。实际上,在构成音频识别的功能中,特征提取是最苛刻的。特征提取与每音频帧(缓冲区)的某些标志系数的计算相对应,每音频帧的某些标志系数表征随时间、频率或两者而变化的音频信号。
特别地,Andén和Mallat已经提供了能够实现高识别精度的音频识别的有效系数,参见
●J.Andén and S.Mallat:“Multiscale Scattering for Audio Classification.”ISMIR-International Society for Music Information Retrieval conference.2011.(J.Andén和S.Mallat,“音频分类的多尺度散射”,ISMIR-国际音乐信息检索学会会议,2011)
●J.Andén and S.Mallat:“Deep Scattering Spectrum”,IEEE Transactions on Signal Processing,2014.(J.Andén和S.Mallat,“深散射谱”,IEEE信号处理学报,2014)
他们的方法在理论和经验上被证明优于通常用于声学分类的基线方法,例如梅尔频率倒频谱系数(MFCC),参见P.Atrey,M.Namunu,and K.Mohan,“Audio based event detection for multimedia surveillance”ICASSP-IEEE International Conference on Acoustics,Speech and Signal Processing,2006.(P.Atrey,M.Namunu和K.Mohan,“用于多媒体监控的基于音频的事件检测”,ICASSP-IEEE国际声学、语音和信号处理会议,2006)和D.Stowell,D.Giannoulis,E.Benetos,M.Lagrange and M.Plumbley,“Detection and classification of acoustic scenes and events”IEEE Transactions on Multimedia,2015.(D.Stowell,D.Giannoulis,E.Benetos,M.Lagrange和M.Plumbley.“声场和事件的检测和分类”,IEEE多媒体学报,2015)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710951055.4/2.html,转载请声明来源钻瓜专利网。