[发明专利]一种哭叫声音侦测方法和装置在审
| 申请号: | 202110915461.1 | 申请日: | 2021-08-10 |
| 公开(公告)号: | CN113707180A | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 杨凰琳;林友钦 | 申请(专利权)人: | 漳州立达信光电子科技有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;G10L25/18;G10L25/21;G10L25/90 |
| 代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
| 地址: | 363999 福建省*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 哭叫 声音 侦测 方法 装置 | ||
1.一种哭叫声音侦测方法,其特征在于,包括以下步骤:
S1:在声音采集设备未接收到声音数据时,通过设置初始侦测状态,对侦测所需的参数进行初始化以表征所述声音采集设备尚未侦测到任何声音数据的状态,当声音采集设备接收到声音数据后,对所述声音数据进行包括音框(Frame)撷取与频谱等化(Equalization)在内的前处理,生成包含若干个一定长度的音框的时域讯号;
S2:对所述时域讯号的波形数据的均方根进行计算得到所述时域讯号的能量参数,将所述时域讯号的能量参数与预设的能量阀值进行比较,判断所述时域讯号的能量参数是否超过所述能量阀值,若是,则记录所述时域讯号的长度并执行S3;
S3:从多个维度对所述时域讯号进行计算抽取声音特征参数,并储存所述声音特征参数,所述声音特征参数包括频谱峰点位置、基本频率、谐波频率位置、声音清晰度和声音纯度;
S4:分析判断所述时域讯号的长度、所述时域讯号中有声音的音框的长度以及所述声音特征参数是否满足预设的条件,若是则将所述声音数据判断为哭叫声。
2.根据权利要求1所述的方法,其特征在于,所述音框(Frame)撷取具体包括:
采用包括汉明窗口(Hamming Window)在内的方法将所述声音数据撷取为若干个一定长度的音框,并在后续对所述时域讯号中的每个音框进行所述S2至所述S4中的步骤。
3.根据权利要求1所述的方法,其特征在于,所述频谱等化(Equalization)包括:
补偿所述声音采集设备接收声音数据时的失真,具体方法包括强化所述声音数据中的高频的部分。
4.根据权利要求1所述的方法,其特征在于,所述能量阀值为:
一个常数;或
所述时域讯号的最大能量乘以某一预设的百分比的值。
5.根据权利要求1所述的方法,其特征在于,所述频谱峰点位置的抽取具体包括:
对所述时域讯号进行快速傅立叶变换从而估算出频谱振幅,再利用所述频谱振幅估算频谱峰点位置。
6.根据权利要求1所述的方法,其特征在于,所述基本频率和所述谐波频率位置的抽取具体包括:
利用所述频谱峰点位置对所述时域讯号进行声音周期性检查,从而推算所述时域讯号的基本频率(Fundamental frequency)和谐波频率位置。
7.根据权利要求1所述的方法,其特征在于,所述声音清晰度的抽取具体包括:
根据所述谐波频率位置估算所述时域讯号的总谐波数,再根据所述基本频率和所述时域讯号的最大频率计算出最大可能的谐波数,最后根据所述总谐波数和所述最大可能的谐波数对所述声音清晰度进行定义;
所述声音清晰度被定义为:
Clarity=Hm/M x 100%=Hm x F0/Fm x 100%
其中,Clarity表示所述声音清晰度,F0表示所述基本频率,Fm表示最大信号频率,Hm表示所述总谐波数,M表示所述最大可能的谐波数,且M=Fm/F0。
8.根据权利要求1所述的方法,其特征在于,所述声音纯度的抽取具体包括:
根据各个所述谐波频率位置的波峰的平均值和波谷的平均值的比值来估算谐波波峰的共振强度,再用所述共振强度表示所述声音纯度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于漳州立达信光电子科技有限公司,未经漳州立达信光电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110915461.1/1.html,转载请声明来源钻瓜专利网。





