[发明专利]语音识别装置、语音识别系统以及语音识别方法在审
申请号: | 201880098611.0 | 申请日: | 2018-10-15 |
公开(公告)号: | CN112823387A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 马场直哉;小路悠介 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/28 | 分类号: | G10L15/28 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 邓晔;宋俊寅 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 系统 以及 方法 | ||
1.一种语音识别装置,其特征在于,包括:
语音信号处理部,该语音信号处理部将车辆中就座于多个语音识别对象座位的多个搭乘者的说话语音分离成每个搭乘者的说话语音;
语音识别部,该语音识别部对由所述语音信号处理部分离出的每个所述搭乘者的说话语音进行语音识别,并且计算出语音识别分值;以及
分值利用判定部,该分值利用判定部使用每个所述搭乘者的语音识别分值,来判定在每个所述搭乘者的语音识别结果中采用与哪个搭乘者相对应的语音识别结果。
2.如权利要求1所述的语音识别装置,其特征在于,包括:
图像分析部,该图像分析部使用拍摄了多个所述搭乘者的图像,来计算出每个所述搭乘者的脸的特征量;以及
图像利用判定部,该图像利用判定部使用从每个所述搭乘者的说话语音的起始时刻到结束时刻为止的脸的特征量,对每个所述搭乘者判定是否正在说话,
在存在与由所述图像利用判定部判定为正在说话的2个以上的搭乘者相对应的相同的语音识别结果的情况下,所述分值利用判定部使用2个以上的所述搭乘者中的每个所述搭乘者的语音识别分值来判定是否采用语音识别结果。
3.如权利要求2所述的语音识别装置,其特征在于,
所述图像利用判定部使用每个所述搭乘者的脸的特征量,来判定每个所述搭乘者的说话区间,
所述语音识别部不对由所述图像利用判定部判定为没有说话区间的搭乘者的说话语音进行语音识别。
4.如权利要求1所述的语音识别装置,其特征在于,包括:
对话管理数据库,该对话管理数据库定义了语音识别结果与应执行的功能之间的对应关系;以及
响应决定部,该响应决定部参照所述对话管理数据库,来决定与由所述分值利用判定部所采用的语音识别结果相对应的功能。
5.如权利要求2所述的语音识别装置,其特征在于,
所述图像利用判定部针对每个所述搭乘者,计算出表示是否正在说话的判定的可靠度的判定分值,
在存在与由所述图像利用判定部判定为正在说话的2个以上的搭乘者相对应的相同的语音识别结果的情况下,所述分值利用判定部使用2个以上的所述搭乘者中的每个所述搭乘者的语音识别分值及判定分值中的至少一方,来判定是否采用语音识别结果。
6.一种语音识别装置,其特征在于,
语音信号处理部,该语音信号处理部将车辆中就座于多个语音识别对象座位的多个搭乘者的说话语音分离成每个搭乘者的说话语音;
语音识别部,该语音识别部对由所述语音信号处理部分离出的每个所述搭乘者的说话语音进行语音识别,并且计算出语音识别分值;
意图理解部,该意图理解部使用每个所述搭乘者的语音识别结果,来理解每个所述搭乘者的说话的意图,并且计算意图理解分值;以及
分值利用判定部,该分值利用判定部使用每个所述搭乘者的语音识别分值和意图理解分值中的至少一方,来判定在每个所述搭乘者的意图理解结果中采用与哪个搭乘者相对应的意图理解结果。
7.如权利要求6所述的语音识别装置,其特征在于,包括:
图像分析部,该图像分析部使用拍摄了多个所述搭乘者的图像,来计算出每个所述搭乘者的脸的特征量;以及
图像利用判定部,该图像利用判定部使用从每个所述搭乘者的说话语音的起始时刻到结束时刻为止的脸的特征量,来对每个所述搭乘者判定是否正在说话,
在存在与由所述图像利用判定部判定为正在说话的2个以上的搭乘者相对应的相同的意图理解结果的情况下,所述分值利用判定部使用2个以上的所述搭乘者中的每个所述搭乘者的语音识别分值和意图理解分值中的至少一方,来判定是否采用意图理解结果。
8.如权利要求7所述的语音识别装置,其特征在于,
所述图像利用判定部使用每个所述搭乘者的脸的特征量,来判定每个所述搭乘者的说话区间,
所述语音识别部不对由所述图像利用判定部判定为没有说话区间的搭乘者的说话语音进行语音识别,
所述意图理解部不对由所述图像利用判定部判定为没有说话区间的搭乘者的说话的意图进行理解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880098611.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:漫游场景中的协调会话计费
- 下一篇:电子换向电动马达