[发明专利]语音识别装置、语音识别方法和记录介质无效

专利信息
申请号: 01119203.8 申请日: 2001-03-14
公开(公告)号: CN1320902A 公开(公告)日: 2001-11-07
发明(设计)人: 赫尔穆特·勒克;南野活树;浅野康治;小川浩明 申请(专利权)人: 索尼公司
主分类号: G10L15/00 分类号: G10L15/00
代理公司: 柳沈知识产权律师事务所 代理人: 马莹
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 装置 方法 记录 介质
【说明书】:

发明涉及一种语音识别装置、一种语音识别方法和一种记录介质。更具体的说,本发明涉及一种语音识别装置和一种语音识别方法,它们能够在例如发言中含有未知的单词时减小语音识别精度的降低,并涉及一种记录介质。

图1示出了一种用来进行连续语音识别的常规语音识别装置的例子的结构图。

将用户生成的语音输入到一话筒1中。在话筒1中,输入的语音转换成一种作为电子信号的音频信号。将这种音频信号提供给一个AD(模-数)转换部分2。在AD转换部分2中,对来自话筒1的作为模拟信号的音频信号进行采样和量化,转换成作为数字信号的音频数据。将这种音频数据提供给特征提取部分3。

特征提取部分3在来自AD转换部分2的音频数据的每个合适的帧都进行如傅立叶变换和滤波之类的声学处理,从而提取出特征,诸如,例如MFCC(Mel频率倒谱系数);并将此特征提供给匹配部分4。此外,特征提取部分3还可以提取诸如频谱、线性预测系数、倒谱系数和线频谱对的特征。

根据例如连续分配HMM的方法同时利用来自特征提取部分3的特征,参考必须的声音模型数据库5、词典数据库6和语法数据库7,匹配部分4对输入到匹配部分4(输入语音)的语音输入进行语音识别。

更具体的说,声音模型数据库5中存储了一个声音模型,它示出了各个声音元素和要进行语音识别的口语中音节的声学特征。这里,由于语音识别是根据连续分配HMM方法进行的,所以对声音模型,例如,使用了HMM(隐马尔可夫模型)。词典数据库6中存储了单词词典,其中描述了每个单词(词汇)的发音信息(音韵信息),这些单词(词汇)是语音识别的对象。语法数据库7中存储了连接(链接)词典数据库6的词典中输入的每个单词的语法规则(语言模型)。这里,作为语法规则,例如也可以使用基于上下文无关语法(CFG)的规则,统计的单词排序概率(N语法)等。

通过参考词典数据库6的单词词典,匹配部分4可以连接存储在声音模型数据库5中的声音模型,从而形成该单词的声音模型(单词模型)。此外,通过参考存储在语法数据库7中的语法规则,匹配部分4可以连接数个单词模型,并根据其特征使用按此方式连接的单词模型,以便用连续分配HMM的方法识别输入到话筒1上的语音。也就是说,匹配部分4可以检测出其中在所观察的特征提取部分3输出的时间序列的特征处的得分(似然性)最大的一系列单词模型,并将与此单词模型序列对应的单词序列作为语音识别的结果输出。

更具体的说,匹配部分4累积单词序列的每个特征出现的概率,此单词序列对应着已连接的单词模型;并把累计数值假定作为一个得分,将得分最高的单词序列作为语音识别结果输出。

得分计算通常是通过共同评价一个声学得分(下文中称作“声学得分”)和一个语言得分(下文中在合适处称作“语言得分”)进行的,其中声学得分是由存储在声音模型数据库5中的声音模型给出的,语言得分是由语法数据库7中存储的语法规则给出的。

更具体的说,例如,在HMM方法的情况中,要根据所观察的特征提取部分3输出的特征序列的概率(出现概率),为每个来自声学模型的单词计算声学得分,声学模型构成了一个单词模型。而且,例如,在bigram的情况中,语言得分是根据连接(链接)的特定单词和正好在它前面的一个单词的可能性来决定的。然后,根据为每个单词共同评价声学得分和语言得分而得到的最后得分(下文中在合适处称作“最后得分”)来决定语音识别的结果。

具体的说,当由N个单词组成的单词序列中的第k个单词表示成wk时,并且单词wk的声学得分表示成A(wk),语言得分表示成L(wk)时,可以根据下面的方程计算出此单词序列的最后得分,例如:

S=∑(A(wk)+Ck×L(wk))

                                      …(1)

其中,∑表示K从1到N变化时的总和,Ck表示应用到单词wk的语言得分L(wk)上的加权。

匹配部分4进行匹配过程,以决定例如将方程(1)所示的最后得分最大化的N和一个单词序列w1,w2,…,wN,并将此单词序列w1,w2,…,wN作为语音识别的结果输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01119203.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top