[发明专利]一种基于机器学习的交互意图识别方法在审
申请号: | 202111328911.3 | 申请日: | 2021-11-10 |
公开(公告)号: | CN114120399A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 何苗;毕健;胡方超;丁军;王玉金 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06V10/774;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 重庆企进专利代理事务所(普通合伙) 50251 | 代理人: | 周辉 |
地址: | 400054 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 交互 意图 识别 方法 | ||
本发明公开了一种基于机器学习的交互意图识别方法,通过摄像头采集图像数据,并提取图像数据中潜在交互对象的特征信息,对特征信息进行降维处理得到特征集;将交互意图按照强度逐级分类,并按照分类给特征集样本增加标签;建立模型训练的数据集;将数据集分为训练集和测试集,利用机器学习方法训练交互意图分类模型;训练后,利用测试集对训练后的交互意图分类模型进行测试与评估,完成交互意图分类模型的训练。采用交互意图分类模型对图像数据中的潜在交互对象进行交互意图识别。本发明具有能够利用视觉信息识别交互意图,提高服务机器人与人交互的自然性与智能性等优点。
技术领域
本发明涉及人机交互技术领域,特别的涉及一种基于机器学习的交互意图识别方法。
背景技术
仿人服务机器人现已在社会中各领域扮演着重要角色,而其想要融入于人类的社会生活中,并和人们进行智能自然交互,需具备类人的社会环境感知能力,即学习、理解和推理多模态信息的能力,识别出社交环境下人类的交互意图,并能进行自主行为决策。人-机器人交互系统中交互意图的检测和识别有助于提高仿人机器人与人交互的自然性与智能性。交互意图识别即判断视线范围内人员是否有主动交流的意愿并推测出该人员的意愿强度。
视觉信息是人类获取外部信息的主要途径,人类大脑处理信息的80%以上来自视觉系统。视觉信息的研究在人机交互领域非常流行,之前已有研究分析了人类的视觉特征信息如情绪、面部表情、肢体动作等与社会交互的关联。因此,如何利用视觉信息让仿人服务机器人更好的理解人的交互意图,并与人进行自然交互成为亟待解决的问题。
发明内容
针对上述现有技术的不足,本发明所要解决的技术问题是:如何提供一种能够利用视觉信息识别交互意图,有利于提高仿人机器人与人交互的自然性与智能性的基于机器学习的交互意图识别方法。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种基于机器学习的交互意图识别方法,其特征在于,先通过摄像头采集图像数据,再采用基于机器学习的交互意图分类模型对图像数据中的潜在交互对象进行交互意图识别;所述交互意图分类模型的训练步骤如下:
S1、通过摄像头采集图像数据,并提取图像数据中潜在交互对象的视线、面部朝向、交互距离以及面部表情的特征信息,对特征信息进行降维处理得到特征集;
S2、将交互意图按照强度逐级分类,并按照分类给特征集样本增加标签;
S3、重复步骤S1和S2,获取包含所述特征集的数据集;
S4、将数据集分为训练集和测试集,基于机器学习方法,利用训练集训练交互意图分类模型;训练后,利用测试集对训练后的交互意图分类模型进行测试,完成交互意图分类模型的训练。
进一步的,所述特征集包含的视觉特征数据{Rg,Rp,D,E},Rg为视线注意力偏移系数,Rp为面部朝向注意力偏移系数,D为社交距离,E为表情交互意图量化参考值。
作为优化,所述视线注意力偏移系数Rg为交互对象的视线落点与摄像头竖直平面中心的偏移距离,并满足下式:
式中,(pxl,pyl,pzl)、(pxr,pyr,pzr)别为相机坐标系下潜在交互对象的左右眼瞳孔坐标,VGL=[vxl vyl vzl]和VGR=[vxr vyr vzr]分别为潜在交互对象的左眼视线和右眼视线的方向向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111328911.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多肽分离纯化系统
- 下一篇:猪只转群盘点方法、装置、电子设备及存储介质