[发明专利]一种非完备信息的博弈策略生成方法在审

专利信息
申请号: 201510491027.X 申请日: 2015-08-11
公开(公告)号: CN105426969A 公开(公告)日: 2016-03-23
发明(设计)人: 李翔;吴朝晖;姜晓红;包友军;陈英芝 申请(专利权)人: 浙江大学
主分类号: G06N7/00 分类号: G06N7/00;G06Q10/06
代理公司: 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人: 张宇娟
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 完备 信息 博弈 策略 生成 方法
【权利要求书】:

1.一种非完备信息博弈的策略生成方法,所述非完备信息的博弈特指具有以下特征的博弈,博弈过程中,对手的行为对自己而言可见;博弈过程中,对手的行为对自己而言可以完美回忆;对手的行为依赖其信息,即对手的行为可以体现对手的信息;

其特征在于,包括以下步骤:

步骤一,对手行为建模:在博弈进行之前,根据该博弈的特定规则,对对手的每一种行为建立模型,所述模型用于将对手的行为与对手信息的概率分布进行映射;

步骤二,行为收集与信息预测:在博弈过程中,记录对手每一次行为的信息,并将这些信息与步骤一中的模型进行匹配和映射,得到对手信息的概率分布;

步骤三,胜率计算:根据步骤二中映射得到的概率分布,通过蒙特卡洛方法进行模拟得到自身的胜率;

步骤四,得到行动:根据步骤三中得到的胜率,通过计算期望值得到相应的行动。

2.根据权利要求1所述的非完备信息博弈的策略生成方法,其特征在于,所述步骤一中的模型以对手的行为作为输入,以对手信息的概率分布作为输出;

具体的,假设对手的信息有k种可能性,记为{a1,a2,…,ak},对于每一种可能性ai,i=1,2,…,k,首先根据对手行为与ai的匹配程度得到一个匹配值mi,然后计算每一种可能性的概率值pi

pi=mi/(m1+m1+…+mn)公式一

从而得到所有可能性的概率分布,也就是一个k维向量{p1,p2,…,pk},其中pi是对手的信息取ai的概率。

3.根据权利要求2所述的非完备信息博弈的策略生成方法,其特征在于,当博弈进行了多个阶段,对手的行为不止一次时,对手的信息为包括了以往的历史行为的一个列表,此时,将对手信息ai多次地与对手不同阶段的行为进行匹配,然后将多个匹配值的乘积作为公式一中的mi的值。

4.根据权利要求3所述的非完备信息的博弈策略生成方法,其特征在于,所述步骤三中,通过蒙特卡洛方法随机选择对手的一个信息,假设为ai,其中ai服从步骤二中产生的概率分布;以ai作为对手信息,并判断博弈的胜负;将蒙特卡洛方法循环若干次,即多次选取对手的信息,多次比较判断博弈胜负,从而得到博弈的胜率pwin

pwin=countwin/countlose

其中,countwin是获胜的次数;countlose是失败的次数。

5.根据权利要求4所述的非完备信息博弈策略的生成方法,其特征在于,所述步骤四中,将步骤三中得到的胜率作为基础进行决策;

具体的,假设胜率为pwin,在当前状态下有m种行动可供选择:

{action1,action2,…actionn},对于行动actioni,如果博弈胜利的收益为payoffi,win,失败的收益为payoffi,lose,则选择收益期望值最高的行动作为最终决策actionresult,即:

Actionresult=actionr,使且x∈[0,n],有Ex≤Er

其中,Ex、Er分别是决策actionx和actionr的收益期望;对于任何决策actioni的收益期望Ei,用如下方法计算:

Ei=pwin×payoffi,win+(1-pwin)×payoffi,lose

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510491027.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top