[发明专利]一种语音解码的方法及装置有效
申请号: | 201210226796.3 | 申请日: | 2012-06-30 |
公开(公告)号: | CN102737638A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 钱胜 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 解码 方法 装置 | ||
1.一种语音解码方法,包括:
A.从待解码的语音特征流中获取当前语音特征帧;
B.利用当前语音特征帧对当前的各条解码路径进行扩展;
C.利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当前的解码路径,并判断待解码的语音特征流是否已到达最后帧,如果是,则从当前的各条解码路径中确定最优解码路径作为对所述待解码的语音特征流进行解码的结果,否则将待解码的语音特征流的下一帧作为当前语音特征帧,返回所述步骤B。
2.根据权利要求1所述的方法,其特征在于,所述步骤B具体包括:
根据已知的语音特征帧之间的状态跳转关系,确定当前的各条解码路径中最后一个状态节点代表的状态至当前语音特征帧之间所有可能的状态跳转,其中一种可能的状态跳转对应由当前语音特征帧的一个状态节点扩展而来的一条解码路径;
根据声学模型和语言模型确定扩展后的各条解码路径的得分。
3.根据权利要求2所述的方法,其特征在于,利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当前的解码路径的步骤具体包括:
从扩展后的各条解码路径中确定违背语音短时平稳特征的解码路径;
降低所述违背语音短时平稳特征的解码路径的得分;
根据各条解码路径的得分选取一条以上的解码路径作为当前的解码路径。
4.根据权利要求3所述的方法,其特征在于,确定违背语音短时平稳特征的解码路径的步骤具体包括:
将扩展后的各条解码路径中相同状态的连续节点数低于限值的解码路径作为违背语音短时平稳特征的解码路径。
5.根据权利要求3所述的方法,其特征在于,根据各条解码路径的得分选取一条以上的解码路径作为当前的解码路径的步骤具体包括:
从各条解码路径中选取得分最高的N条解码路径作为当前的解码路径,其中N为自然数;或者,将各条解码路径中得分与最高分之间差值大于设定值的解码路径剔除并将剩余解码路径作为当前的解码路径。
6.根据权利要求5所述的方法,其特征在于,所述步骤C中确定最优解码路径的步骤具体包括:
将当前的各条解码路径中得分最高的解码路径作为最优解码路径。
7.一种语音解码装置,包括:
接收单元,用于从待解码的语音特征流中获取当前语音特征帧;
扩展单元,用于利用当前语音特征帧对当前的各条解码路径进行扩展;
选取单元,用于利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当前的解码路径,并触发判断单元运行;
判断单元,用于判断待解码的语音特征流是否已到达最后帧,如果是,则从当前的各条解码路径中确定最优解码路径作为对所述待解码的语音特征流进行解码的结果,否则将待解码的语音特征流的下一帧作为当前语音特征帧并触发所述扩展单元运行。
8.根据权利要求7所述的装置,其特征在于,所述扩展单元具体包括:
路径扩展子单元,用于根据已知的语音特征帧之间的状态跳转关系,确定当前的各条解码路径中最后一个状态节点代表的状态至当前语音特征帧之间所有可能的状态跳转,其中一种可能的状态跳转对应当前语音特征帧的一个状态节点扩展而来的一条解码路径;
得分确定子单元,用于根据声学模型和语言模型确定扩展后的各条解码路径的得分。
9.根据权利要求8所述的装置,其特征在于,所述选取单元具体包括:
路径确定子单元,用于从扩展后的各条解码路径中确定违背语音短时平稳特征的解码路径;
惩罚子单元,用于降低所述违背语音短时平稳特征的解码路径的得分;
路径选取子单元,用于根据各条解码路径的得分选取一条以上的解码路径作为当前的解码路径。
10.根据权利要求9所述的装置,其特征在于,所述路径确定子单元将扩展后的各条解码路径中相同状态的连续节点数低于限值的解码路径作为违背语音短时平稳特征的解码路径。
11.根据权利要求9所述的装置,其特征在于,所述路径选取子单元从各条解码路径中选取得分最高的N条解码路径作为当前的解码路径,其中N为自然数;或者,将各条解码路径中得分与最高分之间差值大于设定值的解码路径剔除并将剩余解码路径作为当前的解码路径。
12.根据权利要求11所述的装置,其特征在于,所述判断单元确定最优解码路径的方式具体包括:
将当前的各条解码路径中得分最高的解码路径作为最优解码路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210226796.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种聚氨酯合成革粘合装置
- 下一篇:一种再生革压榨装置