[发明专利]语音识别系统以及语音识别装置有效
申请号: | 201380073708.3 | 申请日: | 2013-11-20 |
公开(公告)号: | CN105027198B | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 小川勇;花泽利行;成田知宏 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/10;G10L15/183;G10L15/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 以及 装置 | ||
具有:识别结果候选比较部(205),其对接收部(204)接收到的多个服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部(206),其根据客户端侧语音识别结果候选、服务器侧语音识别结果候选以及识别结果候选比较部(205)的检测结果,综合客户端侧语音识别结果候选和服务器侧语音识别结果候选,确定语音识别结果。
技术领域
本发明涉及在服务器侧和客户端侧进行语音识别的语音识别系统、以及用于提高该语音识别系统中的客户端侧的语音识别装置的语音识别精度的技术。
背景技术
以往,有一种语音识别系统,该语音识别系统为了提高语音数据的语音识别性能,在服务器侧和客户端侧进行语音识别。
例如,在专利文献1的语音识别装置中,提出了如下这样的方法:首先在客户端侧进行语音识别,当判定为表示客户端侧的语音识别结果的精度的识别分数(score)较差的情况下,在服务器侧进行语音识别,且采用服务器侧的语音识别结果。另外,还提出了如下这样的方法:同时并行地进行客户端侧的语音识别和服务器侧的语音识别,对客户端侧的语音识别结果的识别分数与服务器侧的语音识别结果的识别分数进行比较后,采用识别分数较好的语音识别结果。
另外,在专利文献2的语音识别系统中,提出了如下这样的方法:服务器侧除了语音识别结果以外还发送词类信息(一般名词、助词等),客户端侧使用接收到的词类信息,例如进行将一般名词置换成固有名词等的识别结果修正。
现有技术文献
专利文献
专利文献1:日本特开2009-237439号公报
专利文献2:日本特开2010-85536号公报
发明内容
发明所要解决的课题
然而,在上述的专利文献1所公开的技术中,存在如下这样的课题:首先在客户端侧进行语音识别之后在服务器侧进行语音识别,因此,取得客户端侧的语音识别结果为止的延迟时间与取得服务器侧的语音识别结果为止的延迟时间相加而得到的时间成为响应时间,导致从输入语音到取得结果为止的延迟时间增大。
另外,存在如下这样的课题:对客户端侧与服务器侧的识别分数进行比较来采用更好的识别分数,因此,当服务器侧未发送识别分数的情况下、或者在服务器侧所发送的识别分数的计算方法不清楚的情况下(例如在本公司仅仅开发客户端侧的语音识别而使用其他公司的语音识别服务器的情况下),无法准确地比较客户端侧的识别分数,无法选择高精度的语音识别结果。
另外,在专利文献2所公开的技术中,存在如下这样的课题:客户端侧使用服务器侧所发送的语音识别结果和词类信息,来进行语音识别结果的修正,因此,当服务器侧未发送词类信息的情况下,无法高精度地选择语音识别结果。
本发明正是为了解决如上所述的课题而完成的,其目的在于,抑制从输入语音到取得语音识别结果为止的延迟时间,而且,即使在无法使用服务器侧所发送的识别分数和词类信息等语音识别结果以外的信息的情况下,也高精度地选择语音识别结果。
用于解决课题的手段
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380073708.3/2.html,转载请声明来源钻瓜专利网。