[发明专利]声音关键字检测装置以及声音关键字检测方法有效

申请号：	201710766822.4	申请日：	2017-08-31
公开（公告）号：	CN108630200B	公开（公告）日：	2022-01-07
发明（设计）人：	藤村浩司	申请（专利权）人：	株式会社东芝
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/14;G10L15/22;G06F3/16
代理公司：	中国贸促会专利商标事务所有限公司 11038	代理人：	许海兰
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音关键字检测装置以及方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种声音关键字检测装置，具备：

声音获取单元，获取包含多个帧的声音数据；

关键字评分计算单元，由第1副关键字和所述第1副关键字的后续的第2副关键字构成第1关键字，通过将与所述第1副关键字和所述第2副关键字分别关联起来的音素、音韵、音标、短音节或者标注与所述声音数据的各帧进行匹配，计算针对所述第1副关键字的第1评分和针对所述第2副关键字的第2评分；

关键字检测单元，根据所述第1评分从所述声音数据检测所述第1副关键字，根据所述第2评分从所述声音数据检测所述第2副关键字；

受理决定单元，在从所述多个帧中的一个以上的第1帧检测到所述第1副关键字时，决定受理所述第1副关键字，在从所述多个帧中的一个以上的第2帧检测到所述第2副关键字时，在所述一个以上的第1帧的结束端时间与所述一个以上的第2帧的起始端时间的第1差分处于由第1时间差分阈值和第2时间差分阈值规定的范围内的情况下，决定受理所述第2副关键字；以及

关键字输出单元，在决定了受理所述第2副关键字的情况下，输出所述第1关键字。

2.根据权利要求1所述的声音关键字检测装置，其中，

所述关键字评分计算单元进而在第2关键字由所述第1副关键字和所述第1副关键字的后续的第3副关键字构成的情况下，将与所述第3副关键字关联起来的音素、音韵、音标、短音节或者标注与所述声音数据的各帧进行匹配，从而计算针对所述第3副关键字的第3评分，

所述关键字检测单元进而根据所述第3评分来检测所述第3副关键字，

所述受理决定单元进而在从所述多个帧中的一个以上的第3帧检测到所述第1副关键字时，决定受理所述第1副关键字，在从所述多个帧中的一个以上的第4帧检测到所述第3副关键字时，在所述一个以上的第3帧的结束端时间与所述一个以上的第4帧的起始端时间的第2差分处于由第3时间差分阈值和第4时间差分阈值规定的范围内的情况下，决定受理所述第3副关键字，

所述关键字输出单元进而在决定了受理所述第3副关键字的情况下，输出所述第2关键字。

3.根据权利要求1所述的声音关键字检测装置，其中，

所述关键字评分计算单元进而通过将与第3关键字关联起来的音素、音韵、音标、短音节或者标注与所述声音数据的各帧进行匹配，计算针对所述第3关键字的评分，

所述关键字检测单元进而根据针对所述第3关键字的评分来检测所述第3关键字，输出检测到的所述第3关键字。

4.根据权利要求1所述的声音关键字检测装置，其中，

所述关键字检测单元在针对所述第1副关键字的所述第1评分比第1阈值评分大的情况下，检测所述第1副关键字，在针对所述第2副关键字的所述第2评分比第2阈值评分大的情况下，检测所述第2副关键字。

5.根据权利要求4所述的声音关键字检测装置，其中，

所述声音关键字检测装置还具备第1变更单元，该第1变更单元变更所述第1阈值评分和所述第2阈值评分中的至少一方。

6.根据权利要求5所述的声音关键字检测装置，其中，

所述声音关键字检测装置还具备第1显示控制单元，该第1显示控制单元将用于变更所述第1阈值评分和所述第2阈值评分中的至少一方的用户接口显示于画面，

所述第1变更单元根据使用了所显示的所述用户接口的操作，变更所述第1阈值评分和所述第2阈值评分中的至少一方。

7.根据权利要求1所述的声音关键字检测装置，其中，

所述声音关键字检测装置还具备第2变更单元，该第2变更单元变更所述第1时间差分阈值和所述第2时间差分阈值中的至少一方。

8.根据权利要求7所述的声音关键字检测装置，其中，

所述声音关键字检测装置还具备第2显示控制单元，该第2显示控制单元将用于变更所述第1时间差分阈值和所述第2时间差分阈值中的至少一方的用户接口显示于画面，

所述第2变更单元根据使用了所显示的所述用户接口的操作，变更所述第1时间差分阈值和所述第2时间差分阈值中的至少一方。

9.根据权利要求1所述的声音关键字检测装置，其中，还具备：

关键字获取单元，获取多个关键字；以及

关键字模型构建单元，决定与表示各关键字的音素、音韵、音标、短音节或者标注在所述多个关键字间相同的部分对应的副关键字、和与不同的部分对应的副关键字，使用所决定的所述副关键字，决定复合关键字模型，该复合关键字模型规定分别构成所述多个关键字中的两个以上的关键字的多个副关键字、和该多个副关键字间的发声顺序的前后关系，

所述关键字评分计算单元使用所述复合关键字模型，计算所述第1评分和所述第2评分，

所述受理决定单元使用所述复合关键字模型，决定受理所述第1副关键字和所述第2副关键字。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社东芝，未经株式会社东芝许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710766822.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音关键字检测装置以及声音关键字检测方法有效

专利文献下载