[发明专利]语音识别系统以及语音识别装置有效
申请号: | 201380073708.3 | 申请日: | 2013-11-20 |
公开(公告)号: | CN105027198B | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 小川勇;花泽利行;成田知宏 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/10;G10L15/183;G10L15/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 以及 装置 | ||
1.一种语音识别系统,其特征在于,
该语音识别系统具有服务器装置以及与所述服务器装置连接的客户端侧的语音识别装置,
所述服务器装置具有:
服务器侧接收部,其接收从所述语音识别装置输入的语音数据;
服务器侧语音识别部,其进行所述服务器侧接收部接收到的语音数据的语音识别,生成服务器侧语音识别结果候选;以及
服务器侧发送部,其向所述语音识别装置发送所述服务器侧语音识别部所生成的所述服务器侧语音识别结果候选,
所述语音识别装置具有:
语音输入部,其将所输入的发声语音转换成所述语音数据;
客户端侧语音识别部,其进行所述语音输入部所转换的所述语音数据的语音识别,生成客户端侧语音识别结果候选;
客户端侧发送部,其向所述服务器装置发送所述语音输入部所转换的所述语音数据;
客户端侧接收部,其接收所述服务器侧发送部所发送的所述服务器侧语音识别结果候选;
识别结果候选比较部,其对所述客户端侧接收部接收到的多个所述服务器侧语音识别结果候选进行比较,检测有差异的文本;
识别结果综合部,其根据所述客户端侧语音识别结果候选、所述服务器侧语音识别结果候选以及所述识别结果候选比较部的检测结果,综合所述客户端侧语音识别结果候选和所述服务器侧语音识别结果候选,确定语音识别结果;以及
输出部,其输出所述识别结果综合部所确定的语音识别结果,
所述识别结果综合部以所述有差异的文本为基准对所述服务器侧语音识别结果候选的文本进行分割,将所分割的文本和所述客户端侧语音识别结果候选的文本结合,确定语音识别结果。
2.根据权利要求1所述的语音识别系统,其特征在于,
所述语音识别装置具有输入规则判定部,该输入规则判定部对所述客户端侧语音识别结果与发声规则模式进行比较,判定所述语音数据的发声规则,该发声规则模式将规定的关键字与该关键字的发声规则对应起来,
所述识别结果综合部根据所述客户端侧语音识别结果、所述服务器侧语音识别结果、所述识别结果候选比较部的检测结果以及所述输入规则判定部所判定的发声规则,综合所述客户端侧语音识别结果候选和所述服务器侧语音识别结果候选。
3.根据权利要求2所述的语音识别系统,其特征在于,
所述语音识别装置具有:
输入语音/识别结果存储部,其将所述语音输入部所转换的语音数据以及所述识别结果综合部所确定的语音识别结果对应地保存;以及
识别结果候选修正部,其在装置启动时取得与所述输入语音/识别结果存储部中保存的语音数据对应的服务器侧语音识别结果候选,生成数据库,并且,将所生成的数据库与所述客户端侧接收部接收到的服务器侧语音识别结果候选进行对照,
所述识别结果综合部根据所述识别结果候选修正部的对照结果,综合所述客户端侧语音识别结果候选和所述服务器侧语音识别结果候选。
4.根据权利要求2所述的语音识别系统,其特征在于,
所述识别结果候选比较部对所述客户端侧接收部接收到的多个所述服务器侧语音识别结果候选进行比较,检测多个有差异的文本,且判定所检测出的多个文本是否表示相同内容,
在所述识别结果候选比较部判定为所检测出的多个文本表示相同内容的情况下,所述识别结果综合部将所述检测出的文本置换成基于所述服务器侧语音识别结果的固有名词。
5.一种语音识别装置,其是与具有语音识别功能的服务器装置连接的客户端侧的语音识别装置,其特征在于,
该语音识别装置具有:
语音输入部,其将所输入的发声语音转换成语音数据;
客户端侧语音识别部,其进行所述语音输入部所转换的所述语音数据的语音识别,生成客户端侧语音识别结果候选;
客户端侧发送部,其向所述服务器装置发送所述语音输入部所转换的所述语音数据;
客户端侧接收部,其接收所述服务器装置根据所述客户端侧发送部所发送的所述语音数据而生成的服务器侧语音识别结果候选;
识别结果候选比较部,其对所述客户端侧接收部接收到的多个所述服务器侧语音识别结果候选进行比较,检测有差异的文本;
识别结果综合部,其根据所述客户端侧语音识别结果候选、所述服务器侧语音识别结果候选以及所述识别结果候选比较部的检测结果,综合所述客户端侧语音识别结果候选和所述服务器侧语音识别结果候选,确定语音识别结果;以及
输出部,其输出所述识别结果综合部所确定的语音识别结果,
所述识别结果综合部以所述有差异的文本为基准对所述服务器侧语音识别结果候选的文本进行分割,将所分割的文本和所述客户端侧语音识别结果候选的文本结合,确定语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380073708.3/1.html,转载请声明来源钻瓜专利网。