[发明专利]声音识别装置有效
申请号: | 200780045904.4 | 申请日: | 2007-10-04 |
公开(公告)号: | CN101558443A | 公开(公告)日: | 2009-10-14 |
发明(设计)人: | 竹里尚嘉 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 侯颖媖;胡 烨 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 装置 | ||
技术领域
本发明涉及识别发出的声音的声音识别装置,特别是涉及减少伴随着声音 的误识别而产生的问题的技术。
背景技术
以往,已知一种可以利用声音识别来发出各种指令的车载导航装置。在没 有利用声音识别的车载导航装置中,通过从列表显示的菜单进行选择操作来指 定类别,与之相对,在利用声音识别的车载导航装置中,即使在行驶中等无法 看到列表显示的状态下,例如通过发出类别名称等的声音,也可以指定类别。
由于这样的声音识别是一种只能识别被预先录入声音识别词典中的词汇 的技术,所以在通过声音识别进行输入时,用户需要准确发出表示类别的词语 的声音。然而,由于在车载导航装置中作为检索对象的类别的数量一般而言有 几十种以上,所以用户难以记住车载导航装置中可以利用的类别。另外,将车 载导航装置中可以利用的类别与城市主页或互联网等用户在日常生活中看到 的类别或其他车载导航装置可利用的类别区别开也是十分困难的。
另外,作为相关的技术,专利文献1披露了一种即使没有准确发出设施名 称等输入对象的声音时也可以进行理想的声音识别的声音识别装置。在这种声 音识别装置中,地图数据储存单元储存各设施的正式名称作为基本单词。在声 音识别单元中,检测出基本单词内的派生关键字符串,使用该关键字符串将基 本单词部分地变形。据此,自动生成以其他表现形式表达与基本单词相同的设 施的派生单词。例如,在基本单词“静冈县立裾野高级中学”中包含关键字符 串“静冈县立”、“高级中学”。然后,生成派生单词“裾野高级中学”或“裾 野高中”。针对识别对象,使用这样的派生单词及基本单词,进行声音识别。 所以,最好事先对每个对象储存一个单词。
专利文献1:日本专利特开平11-202891号公报
在应用于以往的车载导航装置的声音识别装置中,尽管有上述的问题,但 仍然只有表现作为车载导航装置的功能的、可进行检索的类别的词汇才被录入 声音识别词典中。因此,用户在发出表达车载导航装置中无法利用的类别的词 语的声音时,会产生由于误识别为其他词语,车载导航装置进行与用户的期望 不同的行为这样的问题。
本发明为解决上述的问题而作,其目的在于提供一种声音识别装置,可以 防止利用声音识别进行动作的装置进行与用户的期望不同的行为。
发明内容
为达到上述目的,本发明所涉及的声音识别装置包括将作为检索对象的词 汇按照类别进行存储的类别数据库,用于车载设备,包括:将发出的声音转换 为电信号,作为发声数据输出的麦克风;用于识别在类别数据库中作为检索对 象的类别的词汇的第一声音识别词典;用于识别在类别数据库中作为检索对象 以外的类别的词汇的第二声音识别词典;通过将从麦克风传送来的发声数据与 第一声音识别词典及第二声音识别词典所包含的词汇对照,识别发出的声音的 声音识别部;在从声音识别部传送来的作为识别结果的词语是通过与第二声音 识别词典所包含的词汇对照而得到的词语时,将表示该词语不是作为检索对象 的类别这一事实的消息作为呈现信息输出的对话控制部;以及将从对话控制部 传送来的呈现信息向外部呈现的呈现部。
根据本发明所涉及的声音识别装置,除了用于识别在类别数据库中作为检 索对象的类别的词汇的第一声音识别词典之外,还包括用于识别在类别数据库 中作为检索对象以外的类别的词汇的第二声音识别词典,使用发声数据和第一 声音识别词典、第二声音识别词典对发出的声音进行识别,在该识别结果是基 于第二声音识别词典得到时,呈现表示该词语不是作为检索对象的类别这一事 实的消息,所以即使在发出类别数据库不能检索的词语的声音时,也能正确识 别发声的词语。其结果是,可以解决由于误识别为其他词语而导致车载导航装 置进行与用户的期望不同的行为这样的问题。另外,在识别结果是基于第二声 音识别词典得到时,呈现表示该事实的消息,所以用户可以不会感到不快地使 用声音识别功能。
附图说明
图1是表示应用本发明的实施方式1所涉及的声音识别装置的车载导航装 置的结构的方框图。
图2是以对话控制处理为中心表示本发明的实施方式1所涉及的声音识别 装置的动作的流程图。
图3是表示应用本发明的实施方式2所涉及的声音识别装置的车载导航装 置的结构的方框图。
图4是以对话控制处理为中心表示本发明的实施方式2所涉及的声音识别 装置的动作的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780045904.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多速变速驱动桥
- 下一篇:注塑机用的液压驱动设备