[发明专利]一种基于音频的事件检测方法和系统在审
申请号: | 201910886729.6 | 申请日: | 2019-09-19 |
公开(公告)号: | CN111863029A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 李武波;张睿雄 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L25/12;G10L25/24 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 100193 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音频 事件 检测 方法 系统 | ||
本申请实施例公开了一种基于音频的事件检测方法和系统。所述基于音频的事件检测方法包括:获取一段音频信号;将所述音频信号切割成多个音频片段;对所述多个音频片段进行处理,以确定所述音频信号中是否包含目标事件。本申请采用了在神经网络模型中引入残差连接,可以使神经网络模型同时学习浅层与深层的特征,有效提升了模型对音频信号中目标事件检测的准确性,同时联合多个音频片段是否包含目标事件的确定结果,来确定音频信号中是否包含目标事件的方法,可以增加对音频信号中目标事件检测的准确性。
技术领域
本申请涉及安全监测领域,特别涉及一种基于音频的事件检测方法和系 统。
背景技术
随着经济发展,民众对衣食住行体验的要求越来越高,先进的音频检测是 提供民众体验的一种途径。对于一些可能存在潜在风险的场景(如,网约车服务、 地下停车场),通过录制的音频及时判断出当前场景是否存在目标事件(如,冲 突、抢劫等),并及时实施干预措施具有非常重要的意义。因此,有必要提供一 种基于音频进行目标事件检测的方法,以更准确的判断音频对应的场景是否存 在目标事件(如,冲突、抢劫等),从而可以有效的采取相应的干预措施,以保 证民众的人身安全。
发明内容
本申请实施例之一提供一种基于音频的事件检测方法。所述方法包括:获 取一段音频信号;将所述音频信号切割成多个音频片段;对所述多个音频片段进 行处理,以确定所述音频信号中是否包含目标事件。
在一些实施例中,所述对所述多个音频片段进行处理,以确定所述音频信 号中是否包含目标事件包括:确定所述多个音频片段的一个或多个音频片段中 是否包含目标事件;联合所述一个或多个音频片段中是否包含目标事件的确定 结果,确定所述音频信号中是否包含所述目标事件。
在一些实施例中,所述联合所述一个或多个音频片段中是否包含目标事 件的确定结果,确定所述音频信号中是否包含所述目标事件包括:若任一所述音 频片段中包含目标事件,则确定所述音频信号中包含所述目标事件;若所述音频 片段中全部都未包含目标事件,则确定所述音频信号中未包含所述目标事件。
在一些实施例中,所述将所述音频信号切割成多个音频片段包括将所述 音频信号在时域上切割成多个音频片段。
在一些实施例中,所述目标事件包括冲突、威胁、恐吓、敲诈、勒索、抢 劫、盗窃、猥亵、性侵犯、性骚扰、强奸、车祸中至少一个。
在一些实施例中,所述确定所述多个音频片段的一个或多个音频片段中 是否包含目标事件包括对于音频片段:提取音频片段的特征信息;基于机器学习 模型处理所述特征信息,预测所述音频片段中包含目标事件的概率值。
在一些实施例中,所述确定所述多个音频片段的一个或多个音频片段中 是否包含目标事件还包括:对于音频片段:获取设定阈值;判断所述音频片段中 包含目标事件的概率值是否大于所述设定阈值:若是,则确定所述音频片段中包 含目标事件。
在一些实施例中,所述特征信息包括以下特征中的一种或多种的组合:F- bank特征、线性预测系数、感知线性预测系数、线性预测倒谱系数、梅尔频率 倒谱系数、Tandem特征以及Bottleneck特征。
在一些实施例中,所述机器学习模型包括神经网络模型;所述基于机器学 习模型处理所述特征信息,预测所述音频片段中包含目标事件的概率值包括:机 器学习模型基于当前音频片段的特征信息以及当前音频片段之前的至少一个音 频片段的特征信息确定所述当前音频片段中包含目标事件的概率值。
在一些实施例中,所述神经网络模型包括卷积循环神经网络、卷积神经网 络、深度卷积神经网络、循环神经网络以及长短期记忆模型中至少一个。
在一些实施例中,所述神经网络模型中具有残差连接;所述残差连接用于 将神经网络模型中某一层的输出数据融合到之后层的输入数据中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910886729.6/2.html,转载请声明来源钻瓜专利网。