[发明专利]音声数据检测装置、音声监控系统及其方法有效
申请号: | 201210045216.0 | 申请日: | 2012-02-24 |
公开(公告)号: | CN103295584A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 刘昆;吴伟国 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L25/45 | 分类号: | G10L25/45;G10L25/87 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郭定辉 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 检测 装置 监控 系统 及其 方法 | ||
技术领域
本发明涉及用于音声数据处理的音声数据检测装置、音声监控系统及其方法。
背景技术
近年来,为了保障整个家居环境内的人身财产安全,将监控器用于监控家庭以及周围环境得到了飞速发展。
家庭监控系统不仅通过拍摄图像来监控环境,还可以采集环境音声数据,并通过检测这些声音的类型来确定居室中是否发生了异常情况。例如,需要监控家庭中的婴儿房的时候,检测到婴儿的啼哭声则可判断发生了异常情况并通知业主;而在安全监控的需求下,检测到玻璃破碎声,尖叫声,长时间狗叫声,物体跌落声等可以判断发生了异常并进行报警。因此,需要研究如何对采集到的音声数据进行检测,并准确从中分辨出异常声音。
此外,对于采集生态环境音频数据进行分析,以研究环境中的生物类型等其他应用领域,也需要能够对音声数据进行处理以准确分类的技术,因此该领域是业内科技人员关注的热点课题。
现有的声音识别/检测技术对采集到的声音信号整体进行快速傅里叶变换,获取到声音的频谱,在此基础上提取声音的频率随时间的变化率、频谱能量分布等声音信号的特征数据,进行检测识别。然而,有些声音事件的持续时间很短,比如狗叫声,如果按上述的现有技术将整个音频流直接放到检测系统中进行检测的话,会产生很多的漏检,而无法从中分辨出存在的特定声音。
发明内容
本发明是在考虑到上述问题的情况下做出的。本发明提供音声数据检测装置和音声监控系统,其在对输入的音声数据进行检测分析前,通过谱聚类方法对音声数据流进行分段处理,得到多个单一类型的音声数据段再进行检测,从而避免短时声音事件的漏检。
根据本发明的一个方面,提供一种音声数据检测装置,包括:音声数据接收部件,被配置为接收输入的音声数据流;音声数据处理部件,被配置为利用谱聚类方法对所述音声数据流进行分段处理,以将所述音声数据流分割为多个单一类型的音声数据段;以及声音检测部件,被配置为针对所述音声数据段提取检测特征,并利用预先建立的检测模型对该音声数据段的类型进行检测。。
在根据本发明的音声数据检测装置中,所述音声数据处理部件包括分窗处理部件,被配置为对所述音声数据流进行分窗处理,以得到多窗音声数据,并将每一窗音声数据划分为多个样本以用于谱聚类,其中每一样本包含多帧数据。
在根据本发明的音声数据检测装置中,所述分窗处理部件被配置为根据不定长分析窗对所述音声数据流进行分窗处理,以保证每一窗音声数据内包含的声音事件的完整性。
在根据本发明的音声数据检测装置中,所述分窗处理部件被配置为以预定时长作为初始窗长,每次递增固定步长并以初始窗边界为中心滑动寻找能量包络的最小极值点作为最终窗边界,其中所述极值点不包括由于微小扰动产生的极值点。
在根据本发明的音声数据检测装置中,所述音声数据处理部件还包括:拉普拉斯矩阵构建部件,被配置为构建表示由所述分窗处理部件处理得到的窗音声数据的多个样本的拉普拉斯矩阵;以及聚类部件,被配置为对所述拉普拉斯矩阵的特征向量空间中的特征向量进行聚类处理并将聚类结果映射到所述多个样本上,以将该窗音声数据划分为一个或多个单一类型的所述音声数据段。
在根据本发明的音声数据检测装置中,所述聚类部件被配置为根据所述拉普拉斯矩阵的前三大特征值的相对大小关系,确定聚类处理中涉及的聚类数目。
在根据本发明的音声数据检测装置中,所述聚类部件被配置为根据所述拉普拉斯矩阵的前两大特征值的差值与第二大和第三大特征值的差值之比,来确定聚类数目。
在根据本发明的音声数据检测装置中,在构建拉普拉斯矩阵之前,所述拉普拉斯矩阵构建部件被配置为对所述多个样本的能量特征进行归一化处理,然后映射到指数空间以提高能量特征间的区分性,以用于构建拉普拉斯矩阵。
在根据本发明的音声数据检测装置中,所述能量特征为时域能量特征,以及采用以下映射函数将每一样本中的每帧的时域能量特征映射到所述指数空间,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210045216.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:动力传递装置
- 下一篇:偏置双摆动从动件双斜盘端面凸轮关节轴承高速试验机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置