[发明专利]语音识别装置、方法以及电子设备在审
申请号: | 201410138192.2 | 申请日: | 2014-04-08 |
公开(公告)号: | CN104978963A | 公开(公告)日: | 2015-10-14 |
发明(设计)人: | 石自强;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L15/183 | 分类号: | G10L15/183 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 陶海萍 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 以及 电子设备 | ||
1.一种语音识别装置,该装置包括:
识别单元,其用于对语音进行识别,以获得候选关键词;
解码单元,其结合语义信息,对所述语音中包含识别出所述候选关键词的语音的语音进行解码,以生成与所述包含识别出所述候选关键词的语音的语音对应的词语网格;
计算单元,其根据所述词语网格,计算所述候选关键词的置信度;
判断单元,其根据所述置信度,判断是否将所述候选关键词确定为关键词。
2.根据权利要求1所述的装置,其中,所述识别单元基于填充模型,获得所述候选关键词。
3.根据权利要求1所述的装置,其中,所述解码单元基于隐马尔可夫模型进行所述解码。
4.根据权利要求1所述的装置,其中,
当所述候选关键词的每一个字符都包含在所述词语网格中时,所述计算单元将所述候选关键词的置信度设为第一值。
5.根据权利要求1所述的装置,其中,
所述计算单元计算所述词语网格中第一边的数值的平均值,将所述平均值作为所述候选关键词的置信度,
其中,所述第一边包括与所述候选关键词所在节点连接的边、以及与所述候选关键词中每一个字符所在节点连接的边,每个边的数值表示所述每个边上的一个节点到另一个节点的转移概率。
6.根据权利要求1所述的装置,其中,
所述计算单元计算所述词语网格中第二边的数值的平均值,将所述平均值作为所述候选关键词的置信度,
其中,所述第二边包括与所述候选关键词所在节点连接的边、以及除了所述候选关键词的每一个字符所在节点之间连接的边以外,与所述候选关键词的每一个字符所在节点连接的边,每个边的数值表示所述每个边上的一个节点到另一个节点的转移概率。
7.根据权利要求1所述的装置,其中,
当所述词语网格的最优路径上包含所述候选关键词的每一个字符时,所述计算单元将所述候选关键词的置信度设为第一值。
8.根据权利要求1所述的装置,其中,
当所述候选关键词的所述置信度大于预设阈值时,所述判断单元将所述候选关键词确定为所述关键词。
9.一种电子设备,其具有根据权利要求1-8中任一项所述的语音识别装置。
10.一种语音识别方法,该方法包括:
对语音进行识别,以获得候选关键词;
结合语义信息,对所述语音中包含识别出所述候选关键词的语音的语音进行解码,以生成与所述包含识别出所述候选关键词的语音的语音对应的词语网格;
根据所述词语网格,计算所述候选关键词的置信度;
根据所述置信度,判断是否将所述候选关键词确定为关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410138192.2/1.html,转载请声明来源钻瓜专利网。