[发明专利]婴儿哭声的辩识方法及其系统有效
申请号: | 201611018516.4 | 申请日: | 2016-11-17 |
公开(公告)号: | CN106653001B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 沈晓明 | 申请(专利权)人: | 沈晓明 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L25/48 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200135 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 婴儿 哭声 方法 及其 系统 | ||
1.一种婴儿哭声的辩识方法,其特征在于,包括以下步骤:
a获取婴儿哭声音频的多段训练数据,每个训练数据对应一个已知啼哭原因;
b对每一段训练数据进行特征提取,得到每一段训练数据的特征参数向量;
c对所述多段训练数据的特征参数向量进行主成分分析,得到多个主成分;
d计算每一种啼哭原因对应的训练数据在各主成分上投影分值的均值和方差,根据该方差在所述多个主成分中选择P个主成分,P为大于1的整数;
e获取婴儿哭声音频的待辩识数据,并在所述P个主成分上计算该待辩识数据的投影分值;
f根据该待辩识数据的投影分值和所述均值和方差计算该待辩识数据对应于各个原因的概率,其中第j种原因的概率μjk和σjk分别为第j类哭声原因的哭声信号的特征参数向量在第k个特征向量上投影分值的均值和方差,Zk为待识别的哭声的特征参数向量在所选择的各个主成分方向上的投影分值。
2.根据权利要求1所述的婴儿哭声的辩识方法,其特征在于,所述步骤c包括以下子步骤:
所述多段训练数据包括N个哭声信号样本,对该N个哭声信号样本分别提取K个特征参数,其中,第n个哭声信号提取出的K个特征参数记为特征参数向量sn=[sn1,sn2,...,snK]T;
对所述N个哭声信号样本,计算所述K个特征参数所对应的协方差矩阵,记为C,其中,C为K乘K的矩阵;
对所述协方差阵进行特征值分解,得到K个特征值和相应于该K个特征值的特征向量。
3.根据权利要求2所述的婴儿哭声的辩识方法,其特征在于,所述步骤d包括以下子步骤:
对所述协方差矩阵C进行特征值分解,把特征值按从大到小进行排列,得到{λ1,λ2,...,λK},从中取特征值最大的Q个特征值及其对应的特征向量,构成一个Q维的特征子空间,其中Q的值取的解,g为0.9至0.99之间的一个预设置;
在这Q个主成分中,取其中的第k个主成分,该主成分的特征值记为λk,λk对应的特征向量记为uk,计算第n个哭声信号的特征参数向量sn在第k个特征向量上的投影分值;
求N个哭声信号中属于第j类哭声原因的哭声信号,记为Nj,的K个特征参数向量在第k个特征向量上投影分值的均值
和方差σjk
然后计算
其中
上述各式中,J表示哭声原因的总类型个数,Xk表示哭声信号的特征参数向量在第k个主成分的投影分值的分离度,而Yk表示哭声信号的特征参数向量在第k个主成分的投影分值的集中度,Lk代表各个主成分在对哭声原因的辨别能力,Lk越大意味着其辨别能力越强;
按顺序对Q个主成分进行排列,选取Lk值最大的P个主成分用于后续的哭声原因辨识,其中P取Q和M中较小的值,而h为取值在2%-0.5%之间的一个预设值。
4.根据权利要求1所述的婴儿哭声的辩识方法,其特征在于,还包括以下步骤:
对选定的一组训练数据执行所述步骤a、b、c和d,得到P个主成分;
根据所得的P个主成分,对该组训练数据中的每一个训练数据,分别执行所述步骤e和f以得到该训练数据对应于各个原因的概率,并计算该训练数据所对应的概率最大原因,并将该概率最大原因与该训练数据所对应的已知啼哭原因进行比较;
将概率最大原因与已知啼哭原因不相同的训练数据从所述选定的一组训练数据中剔除,将剩余的训练数据作为新选定的一组训练数据再次执行上述各步骤,如此循环直至满足预定的退出条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈晓明,未经沈晓明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611018516.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于语音信息的情感强度实验方法
- 下一篇:一种文字直播方法及平台