[发明专利]语音识别系统、语音识别程序及语音识别方法有效
申请号: | 200780052250.8 | 申请日: | 2007-03-20 |
公开(公告)号: | CN101636784A | 公开(公告)日: | 2010-01-27 |
发明(设计)人: | 鹫尾信之;原田将治 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 程序 方法 | ||
1.一种语音识别系统,该语音识别系统具有:
特征量计算部,其将输入的声音信号转换成每个帧的特征量;
声音级别计算部,其计算由各帧的所述声音信号的功率或其对数值 表示的输入声音级别、或者由各帧的所述声音信号的振幅或其对数值表 示的输入声音级别;
对照部,其接受特征量计算部计算出的各帧的特征量,与预先存储 的声学模型和语言模型进行对照,并根据相应对照结果来确定要输出的 识别单词串,所述声学模型是对音素的特征量的信息进行建模而得的数 据,所述语言模型是关于识别单词的数据;
始点判断部,其通过将所述声音级别计算部计算出的所述输入声音 级别与基准值进行比较,来确定作为语音区间始点的始点帧并通知给所 述对照部;
终点判断部,其通过将所述声音级别计算部计算出的所述输入声音 级别与基准值进行比较,来确定作为语音区间终点的终点帧并通知给所 述对照部;以及
基准值更新部,其根据所述始点帧以后的输入声音级别的变动来更 新所述基准值,
所述始点判断部在所述基准值更新部更新了基准值时,使用该更新 后的基准值来更新始点帧并通知给所述对照部,
所述对照部在接受了特征量计算部计算出的各帧的特征量而开始对照 后,在从所述终点判断部接收到终点帧的通知之前,从所述始点判断部接 收到始点帧的通知的情况下,根据所通知的始点帧来修正所述对照结果。
2.根据权利要求1所述的语音识别系统,其特征在于,
所述对照部只根据从所述始点判断部通知的所述始点帧到所述终点 判断部通知的所述终点帧的语音区间中包含的帧的特征量的对照结果, 来确定所述识别单词串。
3.根据权利要求1所述的语音识别系统,其特征在于,
所述对照部通过对各帧的特征量的对照结果进行加权来修正所述对 照结果,
所述对照部以如下方式进行加权:使得未包含在从所述始点判断部 通知的所述始点帧到所述终点判断部通知的所述终点帧的语音区间中的 帧的特征量的对照结果的权重小于从所述始点帧到所述终点帧的语音区 间内的帧的特征量的对照结果的权重。
4.根据权利要求1所述的语音识别系统,其特征在于,
所述对照部除去未处于从所述始点判断部通知的所述始点帧到所述 终点判断部通知的所述终点帧的区间中的帧所包含的单词,来确定所述 要输出的识别单词串。
5.根据权利要求1所述的语音识别系统,其特征在于,
所述基准值更新部计算所述始点帧以后的帧的最大输入声音级别, 并根据该最大输入声音级别来更新所述基准值。
6.根据权利要求1所述的语音识别系统,其特征在于,
所述基准值更新部随着时间的经过而阶段性地降低所述基准值。
7.根据权利要求5所述的语音识别系统,其特征在于,
所述基准值更新部随着时间的经过而阶段性地降低计算出的所述最 大输入声音级别。
8.一种语音识别方法,该语音识别方法包括以下步骤:
特征量计算步骤,将输入的声音信号转换成每个帧的特征量;
声音级别计算步骤,计算由各帧的所述声音信号的功率或振幅表示 的输入声音级别;
对照步骤,接受在特征量计算步骤中计算出的各帧的特征量,与预 先存储的声学模型和语言模型进行对照,并根据相应对照结果来输出识 别单词串,所述声学模型是对音素的特征量的信息进行建模而得的数据, 所述语言模型是关于识别单词的数据;
始点判断步骤,通过将所述声音级别计算步骤中计算出的所述输入 声音级别与基准值进行比较,来确定作为语音区间始点的始点帧;
终点判断步骤,通过将所述声音级别计算步骤中计算出的所述输入 声音级别与基准值进行比较,来确定作为语音区间终点的终点帧;以及
基准值更新步骤,根据所述始点帧以后的输入声音级别的变动来更 新所述基准值,
该语音识别方法的特征在于,
在所述始点判断步骤中,当在所述基准值更新步骤中更新了基准值 时,使用该更新后的基准值来更新始点帧,
在所述对照步骤中,接受了特征量计算步骤中计算出的各帧的特征 量而开始对照后,在所述终点判断步骤中确定终点帧之前,在所述始点 判断步骤中更新了始点帧的情况下,根据更新后的始点帧来修正所述对 照结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780052250.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:管理非易失性存储器的扇区的方法
- 下一篇:总有机碳测定装置