[发明专利]一种语音增强方法、语音识别方法、聚类方法及装置有效
申请号: | 201510303746.4 | 申请日: | 2015-06-03 |
公开(公告)号: | CN105989849B | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 王育军 | 申请(专利权)人: | 乐融致新电子科技(天津)有限公司 |
主分类号: | G10L21/0264 | 分类号: | G10L21/0264;G10L15/06 |
代理公司: | 11664 北京华专卓海知识产权代理事务所(普通合伙) | 代理人: | 彭锐<国际申请>=<国际公布>=<进入国 |
地址: | 300453 天津市滨海新区天津中新生*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种语音增强方法、语音识别方法、聚类方法及装置。方法包括:选取与测试语音的第一帧语音部分的特征向量最匹配的特征向量聚类中心;针对测试语音包含的其他各帧语音部分的特征向量执行:从与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;根据测试语音包含的各帧语音部分的特征向量、选取的特征向量聚类中心重建测试语音的特征向量。本发明由于在进行语音增强利用了能够表示语音连续性的特征,因此相比于现有技术中的传统的语音增强模型而言,能够达到更好的语音增强效果。 | ||
搜索关键词: | 一种 语音 增强 方法 识别 装置 | ||
【主权项】:
1.一种语音增强方法,其特征在于,包括:/n从训练得到的特征向量聚类中心中,选取与测试语音包含的第一帧语音部分的特征向量最匹配的特征向量聚类中心;/n针对所述测试语音包含的其他各帧语音部分的特征向量执行:从训练得到的、与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与所述前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;其中,训练得到的每个特征向量聚类中心与至少一个与其相邻的特征向量聚类中心构成的集合具有描述语音连续性的能力;/n根据所述测试语音包含的各帧语音部分的特征向量,以及选取的特征向量聚类中心,重建所述测试语音的特征向量。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐融致新电子科技(天津)有限公司,未经乐融致新电子科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510303746.4/,转载请声明来源钻瓜专利网。
- 上一篇:分离音频源
- 下一篇:一种并联式蜂鸣器和弦音驱动电路