[发明专利]博弈环境系统、博弈智能体以及兵棋智能体的训练方法在审
申请号: | 202310235741.7 | 申请日: | 2023-03-13 |
公开(公告)号: | CN116542333A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 徐泽培;倪晚成;胡健;黄凯奇 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06F18/214 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 窦鑫磊 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 博弈 环境系统 智能 以及 训练 方法 | ||
本申请实施例提供一种博弈环境系统、博弈智能体以及兵棋智能体的训练方法。其中,所述博弈环境系统包括:第一step接口、博弈环境引擎;其中,博弈环境引擎包括动作管理模块;第一step接口用于:对于多个博弈智能体中的任一博弈智能体,从当前博弈智能体的第二step接口,获取当前博弈智能体的动作信息,基于博弈环境引擎采用的推进机制,按照预设处理方式,对动作信息进行处理;将从动作管理模块获取到的动作信息对应的不完全态势信息,通过第二step接口,发送给当前博弈智能体;动作管理模块用于:根据从第一step接口获取到的动作信息生成动作信息对应的不完全态势信息。
技术领域
本申请涉及人工智能技术领域,特别涉及一种博弈环境系统、博弈智能体以及兵棋智能体的训练方法。
背景技术
随着深度学习算法的提出,以及计算机硬件的计算能力的不断提升,还有互联网物联网等产生的海量动态数据,人工智能的第三次浪潮到来。各种专业领域的人工智能在各自的领域中蓬勃发展。但是目前的人工智能领域的成果都是专注于某一领域内的“弱人工智能”,“弱人工智能”在特定的场景下对特定的任务可能有超过人类的水准,但是无法像“通用人工智能”一样理解和习得多种用途的思考能力和智慧。
对于计算机智能博弈技术来说,为了实现“通用人工智能”,需要可以支持智能算法与模型向多种训练场景迁移的博弈环境系统,来满足“通用人工智能”的训练学习和验证的需要。例如,针对不同的兵棋系统,可能使用的是同样的算法或AI内核,但各个平台使用各自的接口将使接口适配成为巨大问题,AI开发者需要适应不同的接口环境,编写许多适配代码。现有的通用智能博弈环境系统,只支持单智能体、同一种推进制的训练方式,无法支持更复杂的场景。
因此,如何实现可以支持多个智能体、多种推进制的博弈环境系统,满足“通用人工智能”的训练学习和验证的需要,是亟待解决的技术问题。
发明内容
本申请实施例提供了一种博弈环境系统、博弈智能体以及兵棋智能体的训练方法,用于实现可以支持多个智能体、多种推进制的博弈环境系统,满足“通用人工智能”的训练学习和验证的需要。
本申请实施例之一提供一种博弈环境系统,所述博弈环境系统包括第一step接口、博弈环境引擎;其中,所述博弈环境引擎包括动作管理模块;所述第一step接口用于:对于多个博弈智能体中的任一博弈智能体,从当前博弈智能体的第二step接口,获取所述当前博弈智能体的动作信息,基于所述博弈环境引擎采用的推进机制,按照预设处理方式,对所述动作信息进行处理;将从动作管理模块获取到的所述动作信息对应的不完全态势信息,通过所述第二step接口,发送给所述当前博弈智能体;所述动作管理模块用于:根据从所述第一step接口获取到的动作信息生成所述动作信息对应的不完全态势信息。
在一些实施例中,所述动作信息携带所述当前博弈智能体的seat标识,所述从当前博弈智能体的第二step接口,获取所述当前博弈智能体的动作信息,包括:从所述第二step接口,获取携带所述当前博弈智能体的seat标识的动作信息;所述根据从所述第一step接口获取到的动作信息生成所述动作信息对应的不完全态势信息,包括:根据携带所述当前博弈智能体的seat标识的动作信息,生成携带所述当前博弈智能体的seat标识的不完全态势信息;所述将从动作管理模块获取到的所述动作信息对应的不完全态势信息,通过所述第二step接口,发送给所述当前博弈智能体,包括:从所述动作管理模块获取携带所述当前博弈智能体的seat标识的不完全态势信息;根据所述seat标识,通过所述当前博弈智能体的第二step接口,将所述不完全态势信息发送给所述当前博弈智能体。
在一些实施例中,所述根据所述seat标识,通过所述当前博弈智能体的第二step接口,将所述不完全态势信息发送给所述当前博弈智能体,包括:从所述动作管理模块获取由至少一个不完全态势信息组成的完整态势信息;根据所述seat标识,从所述完整态势信息中提取所述当前博弈智能体对应的不完全态势信息;将所述当前博弈智能体对应的不完全态势信息,通过所述seat标识对应的博弈智能体的第二step接口,发送给所述当前博弈智能体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310235741.7/2.html,转载请声明来源钻瓜专利网。