[发明专利]语音检测装置无效
| 申请号: | 94193436.5 | 申请日: | 1994-07-18 |
| 公开(公告)号: | CN1064159C | 公开(公告)日: | 2001-04-04 |
| 发明(设计)人: | B·K·莱维斯 | 申请(专利权)人: | 松下电器产业株式会社;语言技术实验室 |
| 主分类号: | G10L11/02 | 分类号: | G10L11/02 |
| 代理公司: | 上海专利商标事务所 | 代理人: | 张政权 |
| 地址: | 日本大阪*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 检测 装置 | ||
1.一种用于检测输入信号中语音的装置,其特征在于包含:
接收语音信号的装置;
存储一个连续m秒间隔内的信号部分的装置;
当接收到新的信号时更新所存储信号部分的装置;
用于确定信号内有限频带能量平滑值(smoothed frequencyband limited energy)的装置,它包含:
用于确定与信号相关的频率的装置;
用于选取信号中频率在预定范围内的部分的装置;
用于确定所选取信号部分内总能量值的装置,所述总能量值为频带能量;以及
用于平滑所述有限频带能量的装置,所得数值为有限频带能量平滑值;
用于确定信号内所述有限频带能量平滑值的方差的装置;
用于根据信号内所述有限频带能量平滑值方差和所述有限频带能量平滑值的先前历程确定信号内语音的开始和结束点的装置。
2.如权利要求1所述的装置,其特征在于,所述用于确定信号内有限频带能量平滑值数值的装置包含:
将汉明窗滤波器应用于部分信号以产生滤波信号的装置;
将傅利叶变换应用于所述滤波信号以产生变换后信号的装置;
用于对所述变换后信号求和以产生该信号部分总能量值的装置,
该信号能量值为有限频带能量;以及
将滤波器应用于所述有限频带能量的装置,所得结果为所述有限频带能量平滑值。
3.如权利要求1所述的装置,其特征在于m介于0与10秒之间。
4.如权利要求1所述的装置,其特征在于所述存储信号部分的装置包含移位寄存器。
5.如权利要求1所述的装置,其特征在于,所述确定有限频带能量平滑值方差的装置包含:
存储多个有限频带能量平滑值数值的装置,该数值作为时间的函数被存储;
计算方差V的装置,V由V=g(A,B)给出;这里
BLE(f)表示多个有限频带能量平滑值,nv是数值的编号,f=nv,…,3,2,1;
而BLE(1)为保留时间最长的BLE数值。
6.如权利要求5所述的装置,其特征在于,所述确定有限频带能量方差值的装置包含:
当接收到新的BLE(nv)数值时计算V=g(A’,B’)的装置,这里
A’=A+[BLE(nv)×BLE(nv)]-[BLE(0)×BLE(0)];
B’=B+BLE(nv)-BLE(0);
A’为A的更新值,B’为B的更新值,以及
BLE(nv)为最新的BLE数值,而BLE(1)为保留时间最长的BLE数值。
7.如权利要求1所述的装置,其特征在于,所述根据有限频带能量平滑值的方差确定语音信号内语音开始和结束之处的装置包含:
当所述有限频带能量平滑值超过预先设定的能量阈值时确定语音开始(B)的装置;以及
当所述有限频带能量平滑值的方差低于预先确定的方差下阈值时确定语音结束(E)的装置。
8.如权利要求7所述的装置,其特征在于,所述能量阈值和方差下阈值都是预先确定的,并且语音信号的开始(B)之处确定为有限频带能量平滑值首次超过能量阈值水平前的z秒。
9.如权利要求8所述的装置,其特征在于z介于0与100秒之间。
10.如权利要求7所述的装置,其特征在于,所述上阈值和下阈值都是预先确定的,并且语音信号的结束(E)点确定为有限频带能量平滑值的方差低于方差下阈值之前的z秒。
11.如权利要求10所述的装置,其特征在于z介于0与100秒之间。
12.如权利要求7所述的装置,其特征在于,语音信号的结束(E)之处确定为在有限频带能量平滑值的方差低于方差下阈值之前的最后一次有限频带能量平滑值低于能量阈值的地方。
13.如权利要求1所述的装置,其特征在于,所述根据有限频带能量平滑值的方差和有限频带能量平滑值的先前历程确定语音信号内语音开始和结束点的装置包含精心设计的神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社;语言技术实验室,未经松下电器产业株式会社;语言技术实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94193436.5/1.html,转载请声明来源钻瓜专利网。





