[发明专利]一种基于频谱高点的空号检测方法和系统有效
申请号: | 202110194910.8 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112954118B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 彭勇;毕争;张嵛翔 | 申请(专利权)人: | 上海井星信息科技有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;G10L25/03;G10L25/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200540 上海市金山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 频谱 高点 检测 方法 系统 | ||
1.一种基于频谱高点的空号检测方法,其特征在于:建立外呼样本库;将语音文件转化为频谱图,对频谱图进行数据清理后,设定基带,在各基带中查找能量最高点,对能量最高点进行连接,形成连接关系数组,对连接关系数组进行HASH处理,得到包括HASH值与时间点的分析数组,将分析数据在样本库中进行匹配,将满足设定条件的匹配样本,与分析数据进行HASH,得到第二HASH值,计算具有相同第二HASH值的匹配样本数量,若匹配样本数量大于设定阈值,则识别成功,若匹配样本数量小于等于设定阈值,则识别失败,得到外呼结果。
2.根据权利要求1所述基于频谱高点的空号检测方法,其特征在于:将语音文件转化为时域图,对时域图进行SIFT变换,生成频谱图。
3.根据权利要求2所述基于频谱高点的空号检测方法,其特征在于:将语音文件byte数组,转化为short数组,再将short数组转化为float数组,根据float数组生成时域图;short数组转化为float数组的转化公式,如下式所示:
float[i]=(shorts[2*i]/32768f+shorts[2*i+1]/32768f)/2;
式中,i表示数组,转换后float数据为[-1,1]的参数。
4.根据权利要求2所述基于频谱高点的空号检测方法,其特征在于:对时域图进行SIFT变换,将所有float数组分成设定大小的窗口,相邻前后两个窗口中,后一个窗口的前半部分与前一个窗口的后半部分数据重叠,以窗口的一半作为取值间隔,每隔一取值间隔向后生成设定大小的窗口,形成包含时间、频率、能量谱密度的频谱图。
5.根据权利要求1所述基于频谱高点的空号检测方法,其特征在于:设定第一频率范围与能量谱阈值,满足能量谱阈值且属于第一频率范围的数据为有效数据,实现对数据的清理。
6.根据权利要求1所述基于频谱高点的空号检测方法,其特征在于:选定基带范围,查找所有窗口中处于同一基带的能量谱,在窗口中任选一能量数据点,在其两边分别查找第一设定数量的最大能量点,从二个第一设定数量的高能量点中,再选择第二设定数量的高能量点,作为该基带的能量高点。
7.根据权利要求6所述基于频谱高点的空号检测方法,其特征在于:将同一基带内,满足第二频率范围、间隔个数范围的能量最高点进行连接,形成连接关系数组,对连接关系数组进行HASH处理,得到第一HASH值,组成包括第一HASH值与时间点的分析数组。
8.根据权利要求7所述基于频谱高点的空号检测方法,其特征在于:
Hash方法如下:
int dt=link.end.intTime-link.start.intTime;
int df=link.end.intFreq-link.start.intFreq+300;
int freq=link.start.intFreq;
int hash=freq+5000*(df+600*dt);
式中,dt表示时间差,df表示频率差,freq表示频率起始点。
9.一种基于频谱高点的空号检测系统,包括存储器、处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-8任一所述方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海井星信息科技有限公司,未经上海井星信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110194910.8/1.html,转载请声明来源钻瓜专利网。