[发明专利]基于贝叶斯定理的车辆多模态交互方法有效
申请号: | 202110730524.6 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113408459B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 温泉;许秋阳;文皓;许李灿;边钦;胡兴军 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06V20/59 | 分类号: | G06V20/59;G06V40/20;G06V40/16;G10L15/22;G06N3/08 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 魏征骥 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贝叶斯 定理 车辆 多模态 交互 方法 | ||
1.一种基于贝叶斯定理的车辆多模态交互方法,其特征在于,包括下列步骤:
步骤1:多传感器综合采集多模态行为信息:
通过姿态检测专用摄像头拍摄驾驶员的行为动作,获得驾驶员进行不同操作时的姿态变化;通过前置摄像头拍摄驾驶员面部照片,获得驾驶员表情信息;通过眼动仪传感器捕捉眨眼的动作,判断驾驶人员疲劳程度;通过车载智能语音系统得到驾驶员语音信息,获得驾驶员具体指令;
步骤2:特征提取:
对传感器采集信息的数据进行特征提取,形成对驾驶员人体行为的底层表达;并从所述特征出发,进一步对各信息进行数字化表示,确定其与贝叶斯网络节点之间的对应关系,并确定取值;其中:
姿态检测专用摄像头可以通过人体骨骼跟踪技术实时地处理并得到操作者的骨骼模型以及骨骼模型中关键节点的三维坐标数据,开车时人们使用上肢的肢体语言,通过上半身运动来传达自己的真实意图,选取左手手腕关节点、右手手腕关节点、左手手肘关节点、右手手肘关节点、左肩关节点、右肩关节点以及头部关节点七个关节点作为关键点,获取其三维坐标数据,然后对坐标数据进行检测处理,将每个点的活动范围都分为9个区域,用0-8表示,当某个关键点的坐标落入某个区域时我们就用该区域的数字来表示,将处理后的七个关键点数据保存到特征E1,E2,E3,E4,E5,E6,E7中,它们的取值都为0-8;
前置摄像头拍摄的用户面部照片通过训练好的深度卷积神经网络识别表情E8,不同的表情在E8中用不同的数字表示;
眼动仪传感器可以通过数据分析,获得特征PERCLOS即单位时间内眼睛闭合时间所占的百分率、特征BF即眨眼频率和特征MECD即一定时间内,最长一次眼部闭合持续的时间,用于专注和疲劳程度检测,对PERCLOS特征、BF特征和特征MECD分别进行离散化处理,划分为五档,分别用数字0-4来表示并保存在特征E9、E10和E11中;
车载智能语音系统通过麦克风获取语音信息并通过自然语言识别转为相应的文本描述信息,再将预先设定的关键词信息提取到E12中,不同的语音信息在E12中用不同的数字表示;
步骤3:基于现实数据的贝叶斯网络搭建及训练:
获取过往现实情景下车辆行驶时的多传感器采集数据,对其进行特征提取并结合驾驶员的真实行为意图构建训练数据集,利用训练数据集中的样本搭建并训练贝叶斯网络,确定其网络结构和概率分布,得到训练好的贝叶斯网络,从而建立特征和用户行为意图之间的映射关系,实现多种特征与单一结果判定一一对应的映射关系;
步骤4:将获取到的多模态特征信息输入基于现实数据搭建的贝叶斯网络,得到用户的真实意图;
步骤5:根据推断出的用户意图,反馈执行装置通过视觉、听觉、触觉多模态对用户进行反馈。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110730524.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速测量夯土压实系数的方法
- 下一篇:一种电池包热管理用低导热保温材料