[发明专利]一种车载语音处理方法及车载信息娱乐系统有效
申请号: | 202110509345.X | 申请日: | 2021-05-11 |
公开(公告)号: | CN112951216B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 杨凤丽 | 申请(专利权)人: | 宁波均联智行科技股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/25;G10L15/26;B60R16/02;G06K9/00;G06N20/00 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 陈怡 |
地址: | 315040 浙江省宁*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车载 语音 处理 方法 信息 娱乐 系统 | ||
1.一种车载语音处理方法,其特征在于,应用于车载信息娱乐系统,所述方法包括:
获取至少两个用户的实时图像;
根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象,所述目标交互对象包括其他用户、车载信息娱乐系统及无确定交互对象;
根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理;
其中,所述根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象,包括:
根据所述至少两个用户的实时图像,识别所述至少两个用户的姿态数据;
根据所述至少两个用户的姿态数据,识别所述至少两个用户是否存在正在进行交互的对象;
若存在,根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象。
2.根据权利要求1所述的车载语音处理方法,其特征在于,所述姿态数据包括实时唇部动作,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括:
根据所述至少两个用户的实时唇部动作判断所述至少两个用户是否处于互相交谈状态;
当判断所述至少两个用户处于互相交谈状态时,确定所述至少两个用户的目标交互对象为车内用户。
3.根据权利要求1所述的车载语音处理方法,其特征在于,所述姿态数据包括注视方向,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括:
对于所述至少两个用户中的用户,若该用户的注视方向为预设方向,或者,若该用户的注视方向所望向的车内位置与预设的目标位置的距离不超过预设距离阈值,则确定该用户的目标交互对象为所述车载信息娱乐系统。
4.根据权利要求1所述的车载语音处理方法,其特征在于,所述姿态数据包括身体姿势,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括:
对于所述至少两个用户中的用户,若该用户的身体姿势满足相应的预设条件,则确定该用户的目标交互对象为车内用户。
5.根据权利要求1所述的车载语音处理方法,其特征在于,所述根据所述至少两个用户的实时图像,识别所述至少两个用户的姿态数据后,所述方法还包括:
当识别到的所述至少两个用户的姿态数据包含预设面部表情时,通过预设图像设备和/或预设语音设备推送所述预设面部表情对应的安抚信息。
6.根据权利要求1至5中任一项所述的车载语音处理方法,其特征在于,所述根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理,包括:
根据所述至少两个用户的目标交互对象,确定所述至少两个用户中是否存在目标交互对象为所述车载信息娱乐系统的用户;
若所述至少两个用户中存在目标交互对象为所述车载信息娱乐系统的用户,采用第一语音识别规则对采集的所述车内实时语音数据进行识别及处理;或,若所述至少两个用户中不存在目标交互对象为所述车载信息娱乐系统的用户,采用第二语音识别规则对采集的所述车内实时语音数据进行识别及处理;或,若无法确定所述至少两个用户中是否存在所述目标交互对象为车载信息娱乐系统的用户,采用第三语音识别规则对采集的所述车内实时语音数据进行识别及处理;
其中,所述第一语音识别规则、所述第二语音识别规则及所述第三语音识别规则所包括的待识别语音关键词不完全相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波均联智行科技股份有限公司,未经宁波均联智行科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110509345.X/1.html,转载请声明来源钻瓜专利网。