[发明专利]基于语音基元的语音编码与合成方法及系统有效
| 申请号: | 200910096638.9 | 申请日: | 2009-03-12 |
| 公开(公告)号: | CN101510424A | 公开(公告)日: | 2009-08-19 |
| 发明(设计)人: | 孟智平;郭海锋 | 申请(专利权)人: | 孟智平 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L19/14 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 646006四川省泸州*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于语音基元的语音编码与合成方法及系统,可用于低带宽高音质的语音传输。本发明在数字语音传输的基础上,以构建的语音基元为编码对象,通过对日常语音的分析,采用聚类算法构建语音基元模型库;然后,利用语音基元自动切分算法,对获得的连续语音流进行语音基元的自动切分,并提取语音基元MFCC特征,通过与语音基元模型库中的语音基元进行匹配识别,获得语音基元所对应的编号,以编号代替语音基元进行编码。在合成语音过程中,通过编号从语音基元模型库中取出该编号所对应的语音基元,并通过数学变换对语音基元的频谱包络进行插值拟合等处理,形成平滑过度的语音。 | ||
| 搜索关键词: | 基于 语音 编码 合成 方法 系统 | ||
【主权项】:
1、一种生成语音基元模型库的方法,其特征在于,包括以下步骤:获取语音流样本数据,并对所述语音流数据进行切分,以获取由不同音素或不同波形为单位所构成的语料库,其中,所述构成语料库的基本单元称为语音基元;提取所述语音基元的特征,构成特征向量;对所述语音基元特征向量样本进行模糊聚类,将所有数据样本分为N类,得到对应的聚类中心和隶属度函数;分析各类语音基元的特征,进而确定拟建语音基元模型库所需的基本语音基元;对各类语音基元的语音特性进行分析处理,以获得每一类音素的频谱包络特征,并将所述频谱包络特征存储于语音基元模型库中,构成语音基元模型库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孟智平,未经孟智平许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910096638.9/,转载请声明来源钻瓜专利网。
- 上一篇:户外架空高压输电防冰冻电缆线
- 下一篇:具有安全存取机制的电子产品





