[发明专利]一种基于持续学习方法的家庭服务型机器人有效
| 申请号: | 202011632228.4 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112784958B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 胡青阳;王瑞琰;高昕;叶晶晶;李永强 | 申请(专利权)人: | 中电海康集团有限公司 |
| 主分类号: | G06N3/045 | 分类号: | G06N3/045;G06N3/092;B25J9/16;B25J11/00 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨天娇 |
| 地址: | 311100 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 持续 学习方法 家庭 服务 机器人 | ||
1.一种基于持续学习方法的家庭服务型机器人,用于为用户提供家政服务,其特征在于,所述基于持续学习的家庭服务型机器人包括:可移动的机器人主体以及连接在所述机器人主体上的机械臂,所述机器人主体包括移动单元、传感设备、语音识别单元、物体识别单元以及AI计算单元,其中:
所述语音识别单元,用于接收用户的语音命令,并基于语音命令解析得到本次家政服务涉及的动作对象、动作对象的初始位置、需要交互的动作,并将所述动作对象、动作对象的初始位置、需要交互的动作发送至所述AI计算单元和所述物体识别单元;
所述传感设备,用于获取机器人主体所在环境的环境信息,并将环境信息反馈至所述AI计算单元和所述物体识别单元;
所述物体识别单元,用于根据动作对象、动作对象的初始位置以及环境信息识别环境中所述动作对象相对于机器人主体的相对位置,并将所述相对位置发送至AI计算单元;
所述AI计算单元,用于根据所述动作对象、动作对象的初始位置、需要交互的动作、环境信息以及相对位置,采用基于持续学习方法的神经网络模型输出动作命令,并将所述动作命令发送至移动单元和机械臂;
所述移动单元,用于根据所述AI计算单元输出的动作命令进行移动;
所述机械臂,用于根据所述AI计算单元输出的动作命令对所述动作对象执行相应操作,以完成本次家政服务;
其中,所述基于持续学习方法的神经网络模型的构建包括:
将家庭服务型机器人能够提供的家政服务分解为B个子任务,对于每个子任务b学习对应的深度技能网络,得到B个子技能策略模型;
通过策略蒸馏方法,将B个子技能策略模型作为教师模型蒸馏得到一个学生模型作为蒸馏技能网络模型;
将移动单元和机械臂的单一动作作为原始动作,将B个子技能策略模型或蒸馏技能网络模型作为技能网络,结合原始动作和技能网络训练深度强化学习模型,得到能够完整执行多个子任务的全局策略网络,该全局策略网络即为基于持续学习的神经网络模型。
2.如权利要求1所述的基于持续学习方法的家庭服务型机器人,其特征在于,所述AI计算单元,根据所述动作对象、动作对象的初始位置、需要交互的动作、环境信息以及相对位置,采用基于持续学习方法的神经网络模型输出动作命令,并将所述动作命令发送至移动单元和机械臂,执行如下操作:
基于持续学习方法的神经网络模型根据所述动作对象、动作对象的初始位置、需要交互的动作、环境信息以及相对位置进行计算,判断并输出当前的动作命令;
若判断得到的动作命令为原始动作,则直接将动作命令发送至移动单元和机械臂;若判断得到的动作命令为技能网络,则将所述动作对象、动作对象的初始位置、需要交互的动作、环境信息以及相对位置发送至所选的技能网络,由技能网络最终计算得到原始动作,并将技能网络计算得到的动作命令发送至移动单元和机械臂。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电海康集团有限公司,未经中电海康集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011632228.4/1.html,转载请声明来源钻瓜专利网。





