[发明专利]一种哭叫声音侦测方法和装置在审

申请号：	202110915461.1	申请日：	2021-08-10
公开（公告）号：	CN113707180A	公开（公告）日：	2021-11-26
发明（设计）人：	杨凰琳;林友钦	申请（专利权）人：	漳州立达信光电子科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L25/03;G10L25/18;G10L25/21;G10L25/90
代理公司：	厦门福贝知识产权代理事务所(普通合伙) 35235	代理人：	陈远洋
地址：	363999 福建省***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种哭叫声音侦测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种哭叫声音侦测方法，其特征在于，包括以下步骤：

S1：在声音采集设备未接收到声音数据时，通过设置初始侦测状态，对侦测所需的参数进行初始化以表征所述声音采集设备尚未侦测到任何声音数据的状态，当声音采集设备接收到声音数据后，对所述声音数据进行包括音框(Frame)撷取与频谱等化(Equalization)在内的前处理，生成包含若干个一定长度的音框的时域讯号；

S2：对所述时域讯号的波形数据的均方根进行计算得到所述时域讯号的能量参数，将所述时域讯号的能量参数与预设的能量阀值进行比较，判断所述时域讯号的能量参数是否超过所述能量阀值，若是，则记录所述时域讯号的长度并执行S3；

S3：从多个维度对所述时域讯号进行计算抽取声音特征参数，并储存所述声音特征参数，所述声音特征参数包括频谱峰点位置、基本频率、谐波频率位置、声音清晰度和声音纯度；

S4：分析判断所述时域讯号的长度、所述时域讯号中有声音的音框的长度以及所述声音特征参数是否满足预设的条件，若是则将所述声音数据判断为哭叫声。

2.根据权利要求1所述的方法，其特征在于，所述音框(Frame)撷取具体包括：

采用包括汉明窗口(Hamming Window)在内的方法将所述声音数据撷取为若干个一定长度的音框，并在后续对所述时域讯号中的每个音框进行所述S2至所述S4中的步骤。

3.根据权利要求1所述的方法，其特征在于，所述频谱等化(Equalization)包括：

补偿所述声音采集设备接收声音数据时的失真，具体方法包括强化所述声音数据中的高频的部分。

4.根据权利要求1所述的方法，其特征在于，所述能量阀值为：

一个常数；或

所述时域讯号的最大能量乘以某一预设的百分比的值。

5.根据权利要求1所述的方法，其特征在于，所述频谱峰点位置的抽取具体包括：

对所述时域讯号进行快速傅立叶变换从而估算出频谱振幅，再利用所述频谱振幅估算频谱峰点位置。