[发明专利]语音处理系统和方法有效
申请号: | 201680076211.0 | 申请日: | 2016-11-04 |
公开(公告)号: | CN108496219B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 托马斯·威廉·约翰·ASH;安东尼·约翰·罗宾逊 | 申请(专利权)人: | 剑桥大学的校长;教师和学者 |
主分类号: | G10L15/193 | 分类号: | G10L15/193;G10L25/51;G09B19/06;G10L25/78;G10L15/187 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 英国剑桥*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 系统 方法 | ||
1.一种语音处理系统,包括:
一输入,用于接收一用户所说的输入话语;
一语音识别系统,识别所述用户所说的所述输入话语并输出一识别结果,所述识别结果包括对应于所述输入话语的一系列已识别单词和子词单元;
一声学模型存储器,存储声学语音模型;
一单词对齐单元,被配置为接收由所述语音识别系统输出的该系列已识别的单词和子词单元,并将与接收到的该系列已识别的单词和子词单元对应的一系列所述声学语音模型与表示用户所说的输入话语的一系列声学特征向量对齐,并输出一对齐结果,该对齐结果标识了所接收的该系列已识别的单词和子词单元与表示用户所说的输入话语的一系列声学特征向量之间的时间对齐。
2.根据权利要求1所述的语音处理系统,其特征在于,所述单词对齐单元被配置为输出与所识别的输入话语的词典发音相对应的一系列子词单元。
3.根据权利要求2所述的语音处理系统,还包括子词对齐单元,其被配置为接收与所述词典发音对应的一系列子词单元,并且被配置为确定用户所说的输入话语与词典发音之间的差异,并输出对应于所述用户所说的输入话语的实际发音的一系列子词单元。
4.根据权利要求3所述的语音处理系统,其特征在于,所述子词对齐单元被配置为将与从所述单词对齐单元接收到的词典发音相对应的该系列所述子词单元与由所述用户所说的所述输入话语对齐,同时允许在单词之间插入子词单元,并将一个单词的子词单元替换为其他子词单元。
5.根据权利要求4所述的语音处理系统,其特征在于,所述子词对齐单元被配置为生成具有多个路径的第二网络,所述第二网络允许在单词之间插入子词单元并且使一个单词的子词单元被其他子词单元替换,并且,其中,所述子词对齐单元被配置成将由所述第二网络定义的不同路径的声学语音模型与所述用户所说的输入话语对齐。
6.根据权利要求5所述的语音处理系统,其特征在于,所述子词对齐单元被配置为保持一评分,所述评分表示所述第二网络定义的不同路径的所述声学语音模型和所述用户的所述输入话语之间的匹配接近度。
7.根据权利要求3至6中任一项所述的语音处理系统,还包括一语音评分特征确定单元,其被配置为接收并确定一相似度,该相似度为由所述单词对齐单元输出的该系列所述子词单元与由所述子词对齐单元输出的该系列子词单元之间的相似度。
8.根据权利要求中1至6任一项所述的语音处理系统,还包括一自由对齐单元,所述自由对齐单元被配置为将声学语音模型与所述用户所说的输入话语进行对齐,并且输出对齐结果,该对齐结果包括与所述用户所说的所述输入话语匹配的一系列子词单元。
9.根据权利要求1至6任一项所述的语音处理系统,包括一语音评分特征确定单元,其被配置为接收并确定所述输入话语的多个语音评分特征值。
10.根据权利要求3所述的语音处理系统,其特征在于,还包括一自由对齐单元,所述自由对齐单元被配置为将声学语音模型与所述用户所说的输入话语进行对齐,并且输出对齐结果,该对齐结果包括与所述用户所说的所述输入话语匹配的一系列子词单元,和一语音评分特征确定单元,其被配置为接收并确定所述输入话语的多个语音评分特征值;所述语音评分特征确定单元被配置为确定所述自由对齐单元输出的该系列所述子词单元与所述子词对齐单元输出的该系列子词单元之间的相似度。
11.根据权利要求9所述的语音处理系统,其特征在于,还包括一自由对齐单元,所述自由对齐单元被配置为将声学语音模型与所述用户所说的输入话语进行对齐,并且输出对齐结果,该对齐结果包括与所述用户所说的所述输入话语匹配的一系列子词单元;所述语音评分特征确定单元被配置为确定所述自由对齐单元输出的该系列所述子词单元与所述单词对齐单元输出的该系列子词单元之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于剑桥大学的校长、教师和学者,未经剑桥大学的校长、教师和学者许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680076211.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多显示器设备以及用于控制多显示器设备的方法
- 下一篇:自适应量化