[发明专利]一种基于MFCC特征提取的交叉路口碰撞音频预警测评方法有效

专利信息
申请号: 202110527812.1 申请日: 2021-05-14
公开(公告)号: CN113299317B 公开(公告)日: 2022-04-08
发明(设计)人: 徐启敏;王作亮;李旭 申请(专利权)人: 东南大学
主分类号: G10L25/51 分类号: G10L25/51;G10L25/24;G10L25/87;G10L25/03;G10L25/09;G10L25/78
代理公司: 南京众联专利代理有限公司 32206 代理人: 张天哲
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 mfcc 特征 提取 交叉 路口 碰撞 音频 预警 测评 方法
【权利要求书】:

1.一种基于MFCC特征提取的交叉路口碰撞音频预警测评方法,其特征在于:利用组合导航系统获取主车HV、路侧单元以及远车RV在行驶过程中的基础参数信息,利用麦克风获取主车上的音频预警信息,并采集交叉路口碰撞预警ICW中HV、RV、路侧单元的通讯接口信息,采用语音识别算法和数据插值方法进行数据处理,实现对通信距离、数据更新频率、系统延迟、预警时间指标的测评;具体步骤包括:

步骤一:基础参数采集

为HV、RV、路侧单元安装组合导航系统,为HV安装麦克风及语音识别设备;组合导航与ICW的系统时间均以北斗时间为参考基准;测试过程需采集ICW的通讯接口信息,包含HV、RV以及路侧单元收到和发出消息的时间信息;

测评所需的基础参数信息包括:HV的经纬度坐标、速度、航向角、语音预警信号以及HV收到路侧单元发出消息的时刻;RV的经纬度坐标、速度、航向角以及RV向路侧单元发出消息的时刻;路侧单元的经纬度坐标、路侧单元收到RV发出消息的时刻以及路侧单元向HV发出消息的时刻;

步骤二:预警信号识别

首先对采集的音频信号进行端点检测,分离出有效的语音段,然后提取各语音段的Mel频率倒谱系数MFCC,对语音的MFCC特征向量采用动态时间规整算法DTW进行语音识别,具体步骤如下:

子步骤1:基于双门限法的音频端点检测

首先对语音信号进行分帧,以T秒为一帧,步长为p秒,分帧得到信号F,假设语音信号的采样频率为f,每一帧语音中的样本个数为N=T×f;

则每一帧计算信号的短时能量为:

每一帧信号的短时过零率为:

其中m表示第m帧,qm(n)表示第m帧的语音信号;

语音信号的阈值为:右端点取短时能量均值的一半左端点取语音信号前5帧的均值与短时能量均值的五分之一之和其中,Q为待识别的语音信号;过零率阈值l表示语音信号的帧数;

利用这三个阈值对语音信号进行端点检测,首先用High对分帧后的信号F进行搜索,以短时能量大于High的帧为起点,小于High的帧为终点,将语音分成若干段;然后用Low对第一次分段进行扩展,以第一次分段的左右端点为起点,分别向左右两边扩展,若帧的短时能量大于Low则进行扩展,小于Low则不进行扩展;最后利用z对第二次扩展结果再次进行扩展,若帧的短时过零率大于z则进行扩展,小于z则不进行扩展;至此,端点检测结束,得到以帧为单位的有效语音列表;

子步骤2:MFCC特征提取

对每一段有效语音提取其MFCC特征,其中提取一段语音信号Q'的MFCC特征的具体步骤如下:

(1)对语音信号进行预加重处理,方式如下:

Q”(n)=Q'(n)-μQ'(n-1),μ取0.97

其中,Q'(n)表示语音信号的每一个采样点;

(2)保留基于双门限法的音频端点检测的分帧结果,每一帧语音中的样本个数为N;

(3)分帧后,对每一帧信号q”(n)加窗,采用汉明窗:

a取0.46

(4)对每一帧语音做离散傅里叶变换:

(5)定义一个有M个滤波器的滤波器组,采用的滤波器为三角滤波器,M取26;滤波器的定义如下:

f(m)定义为:

Fmel(f)=1125ln(1+f/700)

fl为滤波器定义的最低频率,fh为滤波器定义的最高频率,fs为采样频率;

将能量谱通过上述三角滤波器组,并计算每个滤波器组输出的对数能量:

(6)将上述的对数能量带入离散余弦变换,求出L阶的梅尔倒谱参数,L指MFCC系数阶数,取12-16;

(7)动态差分参数计算,公式为:

求出一阶差分参数后,将一阶差分参数再带入求得二阶差分参数,Θ取1或2;

取梅尔倒谱参数、一阶差分参数以及二阶差分参数的前13个系数,得到该帧语音的MFCC特征向量;

子步骤3:DTW算法语音识别

假设一段语音信号提取到的特征为(u0,u1,...,um-1),以已经提取过MFCC特征的标准语音为模板S=(s0,s1,...,sn-1),按照DTW算法计算每一帧语音MFCC特征的累计距离为:

其中,d(si,uj)=||si-uj||2,si和uj表示每一帧语音的MFCC特征向量,D(n-1,m-1)即为的相似性度量结果,当时,匹配成功,λ可根据实际调试效果进行调整,语音分段的起始位置就是预警发出的时间;

步骤三:交叉路口碰撞音频预警测评

(1)通信距离测评

首先,定义通讯距离为路侧单元第一次收到RV消息时,路侧单元与RV的距离;假设该时刻为tc,当组合导航信息的采集时刻没有tc的对应值时,采用插值方法取得tc时刻车辆的位置信息,k表示组合导航采样数据的编号,假设当前时刻tc介于tk与tk+1之间,tk时刻经纬度坐标为(xk,yk),以经度计算为例取tk-1、tk、tk+1、tk+2做自然三次样条插值:

h0=tk-tk-1,h1=tk+1-tk,h2=tk+2-tk+1

f[tk-1,tk,tk+1]表示三阶差商,其中f[tk-1,tk]表示二阶差商,完成以上参数计算后,列矩阵方程:

解矩阵方程得M2、M3,写出方程系数:

得到方程s2(t)=a2+b2(t-tk)+c2(t-tk)2+d'2(t-tk)3,tk<t≤tk+1,计算s2(tc),得到tc时刻经度xc,以同样的方法计算纬度,得到当前RV的经纬度坐标(xc,yc),已知路侧单元的位置为(xs,ys),两者之间距离为:

d=R×arcos[cos(ys)×cos(yc)×cos(xs-xc)+sin(ys)×sin(yc)]

其中R为地球半径,取6371.0km,反余弦函数的值取弧度值;

(2)数据更新频率测评

统计测试时长Ts内HV收到的数据数量为A,则数据更新频率为A/Ts

(3)系统延迟测评

假设对于同一条逻辑关系的信息,RV向路侧单元发送消息的时刻为trs,路侧单元收到RV消息的时刻为ts,路侧单元向HV发送消息的时刻为tsh,HV收到路侧单元消息的时刻为th,则系统延时可以计算为:

RV与路侧单元收发消息的延时为ts-trs

路侧单元与HV之间收发消息的延时为th-tsh

系统整体延时为th-trs

(4)预警时间测评

假设由步骤二得到预警发出时刻为tw,以预警发出时刻tw为基准,用插值的方法得到该时刻HV的经纬度坐标(x1,y1)与航向角θ1,以及该时刻RV的经纬度坐标(x2,y2)与航向角θ2,速度信息同样有可能存在采集时间上的不一致,采用线性插值方法求得tw时刻的速度信息;

假设tw介于tj与tj+1之间,tj时刻车辆速度为vj,tj+1时刻车辆速度为vj+1,采用线性插值的方法求得tw时刻车辆的速度v=(vj+1-vj)×f×(tw-tj),其中f为组合导航的采样频率,即1/(tj+1-tj),按照上述方法,计算HV和RV在tw时刻的速度分别为v1、v2

由车辆的经纬度坐标和航向角可以写出沿车辆当前行驶方向的直线y-y1=tanθ1(x-x1),y-y2=tanθ2(x-x2),计算两直线的交点可以得到预计碰撞点的坐标为:

由通信距离测评中计算距离的方式可以算出HV与RV与预计碰撞点的距离分别为l1、l2,到达碰撞点的时间分别为t1=l1/v1,t2=l2/v2;若|t1-t2|<ε,表示两车到达碰撞点的时间足够接近,即两车会发成碰撞,若t1满足2.7s<t1<4.4s,则判断ICW预警有效。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110527812.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top