[发明专利]智能体的控制方法、装置、电子设备和存储介质在审
| 申请号: | 202211457362.4 | 申请日: | 2022-11-17 |
| 公开(公告)号: | CN115730630A | 公开(公告)日: | 2023-03-03 |
| 发明(设计)人: | 韩翠云;曾增烽;张记袁 | 申请(专利权)人: | 百度时代网络技术(北京)有限公司 |
| 主分类号: | G06N3/008 | 分类号: | G06N3/008;G06N20/00 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
| 地址: | 100080 北京市海淀区东*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 控制 方法 装置 电子设备 存储 介质 | ||
1.一种智能体的控制方法,所述方法包括:
获取多个智能体的目标状态数据,其中,所述多个智能体包括属于第一对象的至少一个智能体和属于第二对象的至少一个智能体;
根据所述多个智能体的目标状态数据,生成状态序列;
将所述状态序列输入智能体策略模型,以根据所述智能体策略模型的输出,确定动作序列;其中,所述动作序列中包括属于所述第一对象的各智能体的目标控制动作;
根据所述动作序列中的各目标控制动作,对属于所述第一对象的各智能体进行动作控制。
2.根据权利要求1所述的方法,其中,所述获取多个智能体的目标状态数据,包括:
针对任一所述智能体,获取所述智能体在当前时刻的第一状态数据;
获取所述智能体在所述当前时刻之前的至少一个历史时刻的第二状态数据;
根据所述当前时刻的第一状态数据和所述至少一个历史时刻的第二状态数据,生成所述智能体的目标状态数据。
3.根据权利要求2所述的方法,其中,所述获取所述智能体在当前时刻的第一状态数据,包括:
获取所述智能体在当前时刻的第一子状态数据,其中,所述第一子状态数据用于指示所述智能体在所述当前时刻的位置信息、速度信息和装载的武器信息中的至少一项;
获取第一智能体在当前时刻的第二子状态数据;其中,所述第二子状态数据用于指示所述第一智能体在所述当前时刻的位置信息、速度信息和装载的武器信息中的至少一项,所述第一智能体与所述智能体属于同一对象,且所述第一智能体在所述当前时刻与所述智能体之间的距离小于第一距离阈值;
获取第二智能体在当前时刻的第三子状态数据,其中,所述第三子状态数据用于指示所述第二智能体在所述当前时刻的位置信息、速度信息和装载的武器信息中的至少一项,所述第二智能体与所述智能体属于不同对象,且所述第二智能体在所述当前时刻与所述智能体之间的距离小于第二距离阈值;
根据所述第一子状态数据、所述第二子状态数据和所述第三子状态数据中的至少一项,生成所述智能体的第一状态数据。
4.根据权利要求1所述的方法,其中,所述将所述状态序列输入智能体策略模型,以根据所述智能体策略模型的输出,确定动作序列,包括:
对所述状态序列进行归一化处理;
采用所述智能体策略模型的编码层基于注意力机制对归一化处理后的所述状态序列进行编码,以得到编码特征;
采用所述智能体策略模型的解码层对所述编码特征进行解码,以得到动作序列。
5.根据权利要求4所述的方法,其中,属于所述第一对象的智能体的个数为N,所述采用所述智能体策略模型的解码层对所述编码特征进行解码,以得到动作序列,包括:
采用所述解码层对所述编码特征进行解码,以得到所述动作序列中的首个属于所述第一对象的智能体的目标控制动作;
采用所述解码层基于所述动作序列中第i个属于所述第一对象的智能体的目标控制动作,对所述编码特征进行解码,以得到所述动作序列中的第i+1个属于所述第一对象的智能体的目标控制动作;其中,i为小于N的正整数。
6.根据权利要求5所述的方法,其中,所述采用所述解码层对所述编码特征进行解码,以得到所述动作序列中的首个属于所述第一对象的智能体的目标控制动作,包括:
采用所述解码层对所述编码特征进行解码,以得到所述动作序列中的首个属于所述第一对象的智能体执行多种控制动作的概率;
根据所述首个属于所述第一对象的智能体执行多种控制动作的概率,从所述多种控制动作中确定概率最大的控制动作;
将所述概率最大的控制动作,作为所述首个属于所述第一对象的智能体的目标控制动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度时代网络技术(北京)有限公司,未经百度时代网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211457362.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高稳定性消防水炮车
- 下一篇:一种多糖溶液加工用干燥装置





