[发明专利]声音识别装置有效

申请号：	200780045904.4	申请日：	2007-10-04
公开（公告）号：	CN101558443A	公开（公告）日：	2009-10-14
发明（设计）人：	竹里尚嘉	申请（专利权）人：	三菱电机株式会社
主分类号：	G10L15/00	分类号：	G10L15/00
代理公司：	上海专利商标事务所有限公司	代理人：	侯颖媖;胡烨
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音识别装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及识别发出的声音的声音识别装置，特别是涉及减少伴随着声音的误识别而产生的问题的技术。

背景技术

以往，已知一种可以利用声音识别来发出各种指令的车载导航装置。在没有利用声音识别的车载导航装置中，通过从列表显示的菜单进行选择操作来指定类别，与之相对，在利用声音识别的车载导航装置中，即使在行驶中等无法看到列表显示的状态下，例如通过发出类别名称等的声音，也可以指定类别。

由于这样的声音识别是一种只能识别被预先录入声音识别词典中的词汇的技术，所以在通过声音识别进行输入时，用户需要准确发出表示类别的词语的声音。然而，由于在车载导航装置中作为检索对象的类别的数量一般而言有几十种以上，所以用户难以记住车载导航装置中可以利用的类别。另外，将车载导航装置中可以利用的类别与城市主页或互联网等用户在日常生活中看到的类别或其他车载导航装置可利用的类别区别开也是十分困难的。

另外，作为相关的技术，专利文献1披露了一种即使没有准确发出设施名称等输入对象的声音时也可以进行理想的声音识别的声音识别装置。在这种声音识别装置中，地图数据储存单元储存各设施的正式名称作为基本单词。在声音识别单元中，检测出基本单词内的派生关键字符串，使用该关键字符串将基本单词部分地变形。据此，自动生成以其他表现形式表达与基本单词相同的设施的派生单词。例如，在基本单词“静冈县立裾野高级中学”中包含关键字符串“静冈县立”、“高级中学”。然后，生成派生单词“裾野高级中学”或“裾野高中”。针对识别对象，使用这样的派生单词及基本单词，进行声音识别。所以，最好事先对每个对象储存一个单词。

专利文献1：日本专利特开平11-202891号公报

在应用于以往的车载导航装置的声音识别装置中，尽管有上述的问题，但仍然只有表现作为车载导航装置的功能的、可进行检索的类别的词汇才被录入声音识别词典中。因此，用户在发出表达车载导航装置中无法利用的类别的词语的声音时，会产生由于误识别为其他词语，车载导航装置进行与用户的期望不同的行为这样的问题。

本发明为解决上述的问题而作，其目的在于提供一种声音识别装置，可以防止利用声音识别进行动作的装置进行与用户的期望不同的行为。

发明内容

为达到上述目的，本发明所涉及的声音识别装置包括将作为检索对象的词汇按照类别进行存储的类别数据库，用于车载设备，包括：将发出的声音转换为电信号，作为发声数据输出的麦克风；用于识别在类别数据库中作为检索对象的类别的词汇的第一声音识别词典；用于识别在类别数据库中作为检索对象以外的类别的词汇的第二声音识别词典；通过将从麦克风传送来的发声数据与第一声音识别词典及第二声音识别词典所包含的词汇对照，识别发出的声音的声音识别部；在从声音识别部传送来的作为识别结果的词语是通过与第二声音识别词典所包含的词汇对照而得到的词语时，将表示该词语不是作为检索对象的类别这一事实的消息作为呈现信息输出的对话控制部；以及将从对话控制部传送来的呈现信息向外部呈现的呈现部。

根据本发明所涉及的声音识别装置，除了用于识别在类别数据库中作为检索对象的类别的词汇的第一声音识别词典之外，还包括用于识别在类别数据库中作为检索对象以外的类别的词汇的第二声音识别词典，使用发声数据和第一声音识别词典、第二声音识别词典对发出的声音进行识别，在该识别结果是基于第二声音识别词典得到时，呈现表示该词语不是作为检索对象的类别这一事实的消息，所以即使在发出类别数据库不能检索的词语的声音时，也能正确识别发声的词语。其结果是，可以解决由于误识别为其他词语而导致车载导航装置进行与用户的期望不同的行为这样的问题。另外，在识别结果是基于第二声音识别词典得到时，呈现表示该事实的消息，所以用户可以不会感到不快地使用声音识别功能。

附图说明

图1是表示应用本发明的实施方式1所涉及的声音识别装置的车载导航装置的结构的方框图。

图2是以对话控制处理为中心表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。

图3是表示应用本发明的实施方式2所涉及的声音识别装置的车载导航装置的结构的方框图。

图4是以对话控制处理为中心表示本发明的实施方式2所涉及的声音识别装置的动作的流程图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社，未经三菱电机株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200780045904.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音识别装置有效

专利文献下载