[发明专利]声音关键字检测装置以及声音关键字检测方法有效
| 申请号: | 201710766822.4 | 申请日: | 2017-08-31 |
| 公开(公告)号: | CN108630200B | 公开(公告)日: | 2022-01-07 |
| 发明(设计)人: | 藤村浩司 | 申请(专利权)人: | 株式会社东芝 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/14;G10L15/22;G06F3/16 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许海兰 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 关键字 检测 装置 以及 方法 | ||
1.一种声音关键字检测装置,具备:
声音获取单元,获取包含多个帧的声音数据;
关键字评分计算单元,由第1副关键字和所述第1副关键字的后续的第2副关键字构成第1关键字,通过将与所述第1副关键字和所述第2副关键字分别关联起来的音素、音韵、音标、短音节或者标注与所述声音数据的各帧进行匹配,计算针对所述第1副关键字的第1评分和针对所述第2副关键字的第2评分;
关键字检测单元,根据所述第1评分从所述声音数据检测所述第1副关键字,根据所述第2评分从所述声音数据检测所述第2副关键字;
受理决定单元,在从所述多个帧中的一个以上的第1帧检测到所述第1副关键字时,决定受理所述第1副关键字,在从所述多个帧中的一个以上的第2帧检测到所述第2副关键字时,在所述一个以上的第1帧的结束端时间与所述一个以上的第2帧的起始端时间的第1差分处于由第1时间差分阈值和第2时间差分阈值规定的范围内的情况下,决定受理所述第2副关键字;以及
关键字输出单元,在决定了受理所述第2副关键字的情况下,输出所述第1关键字。
2.根据权利要求1所述的声音关键字检测装置,其中,
所述关键字评分计算单元进而在第2关键字由所述第1副关键字和所述第1副关键字的后续的第3副关键字构成的情况下,将与所述第3副关键字关联起来的音素、音韵、音标、短音节或者标注与所述声音数据的各帧进行匹配,从而计算针对所述第3副关键字的第3评分,
所述关键字检测单元进而根据所述第3评分来检测所述第3副关键字,
所述受理决定单元进而在从所述多个帧中的一个以上的第3帧检测到所述第1副关键字时,决定受理所述第1副关键字,在从所述多个帧中的一个以上的第4帧检测到所述第3副关键字时,在所述一个以上的第3帧的结束端时间与所述一个以上的第4帧的起始端时间的第2差分处于由第3时间差分阈值和第4时间差分阈值规定的范围内的情况下,决定受理所述第3副关键字,
所述关键字输出单元进而在决定了受理所述第3副关键字的情况下,输出所述第2关键字。
3.根据权利要求1所述的声音关键字检测装置,其中,
所述关键字评分计算单元进而通过将与第3关键字关联起来的音素、音韵、音标、短音节或者标注与所述声音数据的各帧进行匹配,计算针对所述第3关键字的评分,
所述关键字检测单元进而根据针对所述第3关键字的评分来检测所述第3关键字,输出检测到的所述第3关键字。
4.根据权利要求1所述的声音关键字检测装置,其中,
所述关键字检测单元在针对所述第1副关键字的所述第1评分比第1阈值评分大的情况下,检测所述第1副关键字,在针对所述第2副关键字的所述第2评分比第2阈值评分大的情况下,检测所述第2副关键字。
5.根据权利要求4所述的声音关键字检测装置,其中,
所述声音关键字检测装置还具备第1变更单元,该第1变更单元变更所述第1阈值评分和所述第2阈值评分中的至少一方。
6.根据权利要求5所述的声音关键字检测装置,其中,
所述声音关键字检测装置还具备第1显示控制单元,该第1显示控制单元将用于变更所述第1阈值评分和所述第2阈值评分中的至少一方的用户接口显示于画面,
所述第1变更单元根据使用了所显示的所述用户接口的操作,变更所述第1阈值评分和所述第2阈值评分中的至少一方。
7.根据权利要求1所述的声音关键字检测装置,其中,
所述声音关键字检测装置还具备第2变更单元,该第2变更单元变更所述第1时间差分阈值和所述第2时间差分阈值中的至少一方。
8.根据权利要求7所述的声音关键字检测装置,其中,
所述声音关键字检测装置还具备第2显示控制单元,该第2显示控制单元将用于变更所述第1时间差分阈值和所述第2时间差分阈值中的至少一方的用户接口显示于画面,
所述第2变更单元根据使用了所显示的所述用户接口的操作,变更所述第1时间差分阈值和所述第2时间差分阈值中的至少一方。
9.根据权利要求1所述的声音关键字检测装置,其中,还具备:
关键字获取单元,获取多个关键字;以及
关键字模型构建单元,决定与表示各关键字的音素、音韵、音标、短音节或者标注在所述多个关键字间相同的部分对应的副关键字、和与不同的部分对应的副关键字,使用所决定的所述副关键字,决定复合关键字模型,该复合关键字模型规定分别构成所述多个关键字中的两个以上的关键字的多个副关键字、和该多个副关键字间的发声顺序的前后关系,
所述关键字评分计算单元使用所述复合关键字模型,计算所述第1评分和所述第2评分,
所述受理决定单元使用所述复合关键字模型,决定受理所述第1副关键字和所述第2副关键字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710766822.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声学模型的数据处理方法
- 下一篇:一种用于建立设备关联的方法和装置





