[发明专利]一种车载语音处理方法及车载信息娱乐系统有效
申请号: | 202110509345.X | 申请日: | 2021-05-11 |
公开(公告)号: | CN112951216B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 杨凤丽 | 申请(专利权)人: | 宁波均联智行科技股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/25;G10L15/26;B60R16/02;G06K9/00;G06N20/00 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 陈怡 |
地址: | 315040 浙江省宁*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车载 语音 处理 方法 信息 娱乐 系统 | ||
本申请公开了一种车载语音处理方法及车载信息娱乐系统,该方法包括:获取至少两个用户的实时图像;根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象;根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理,避免了机械地将车内的所有语音数据采用同样的规则进行识别及处理,导致车载信息娱乐系统容易被误唤醒的问题。
技术领域
本申请涉及智能车辆技术领域,尤其涉及一种车载语音处理方法及车载信息娱乐系统。
背景技术
随着技术的发展进步,越来越多的车辆上安装了车载信息娱乐系统,可进一步提高车辆驾驶及操作的便捷性和趣味性。为了提高车载信息娱乐系统的使用效率、且避免影响车辆驾驶安全,越来越多的车辆的车载信息娱乐系统上集成了语音识别功能,使得驾驶者可以直接通过语音操作车载信息娱乐系统,提高了使用过程的安全性。
现有技术中,通常采用使用机器学习模型对实时采集的车内语音数据进行识别及分析,确定车内语音数据中是否提及了预设的关键词,在确定提及后根据提及的关键词对用户进行相应的反馈。然而,用户互相聊天时可能会涉及这些预设关键词,但用户本意并不是唤醒车载信息娱乐系统。这就会导致车载信息娱乐系统被误唤醒,对用户的使用造成影响。
因此,亟需一种可识别用户真实对话意图的车载语音处理方法,以解决现有技术的上述技术问题。
发明内容
为了解决现有技术存在的问题,本申请的主要目的在于提供一种语音处理方法及车载信息娱乐系统,以期解决现有技术的上述技术问题。
为了达到上述目的,第一方面本申请提供了一种车载语音处理方法,应用于车载信息娱乐系统,所述方法包括:
获取至少两个用户的实时图像;
根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象;
根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理。
在一些实施例中,所述根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象,包括:
根据所述至少两个用户的实时图像,识别所述至少两个用户的姿态数据;
根据所述至少两个用户的姿态数据,识别所述至少两个用户是否存在正在进行交互的对象;
若存在,根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象。
在一些实施例中,所述姿态数据包括实时唇部动作,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括:
根据所述至少两个用户的实时唇部动作判断所述至少两个用户是否处于互相交谈状态;
当判断所述至少两个用户处于互相交谈状态时,确定所述至少两个用户的目标交互对象为车内用户。
在一些实施例中,所述姿态数据包括注视方向,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括:
对于所述至少两个用户中的用户,若该用户的注视方向为预设方向,或者,若该用户的注视方向所望向的车内位置与预设的目标位置的距离不超过预设距离阈值,则确定该用户的目标交互对象为所述车载信息娱乐系统。
在一些实施例中,所述姿态数据包括身体姿势,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波均联智行科技股份有限公司,未经宁波均联智行科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110509345.X/2.html,转载请声明来源钻瓜专利网。