[发明专利]一种非完备信息的博弈策略生成方法在审
| 申请号: | 201510491027.X | 申请日: | 2015-08-11 |
| 公开(公告)号: | CN105426969A | 公开(公告)日: | 2016-03-23 |
| 发明(设计)人: | 李翔;吴朝晖;姜晓红;包友军;陈英芝 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06N7/00 | 分类号: | G06N7/00;G06Q10/06 |
| 代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 张宇娟 |
| 地址: | 310027 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 完备 信息 博弈 策略 生成 方法 | ||
1.一种非完备信息博弈的策略生成方法,所述非完备信息的博弈特指具有以下特征的博弈,博弈过程中,对手的行为对自己而言可见;博弈过程中,对手的行为对自己而言可以完美回忆;对手的行为依赖其信息,即对手的行为可以体现对手的信息;
其特征在于,包括以下步骤:
步骤一,对手行为建模:在博弈进行之前,根据该博弈的特定规则,对对手的每一种行为建立模型,所述模型用于将对手的行为与对手信息的概率分布进行映射;
步骤二,行为收集与信息预测:在博弈过程中,记录对手每一次行为的信息,并将这些信息与步骤一中的模型进行匹配和映射,得到对手信息的概率分布;
步骤三,胜率计算:根据步骤二中映射得到的概率分布,通过蒙特卡洛方法进行模拟得到自身的胜率;
步骤四,得到行动:根据步骤三中得到的胜率,通过计算期望值得到相应的行动。
2.根据权利要求1所述的非完备信息博弈的策略生成方法,其特征在于,所述步骤一中的模型以对手的行为作为输入,以对手信息的概率分布作为输出;
具体的,假设对手的信息有k种可能性,记为{a1,a2,…,ak},对于每一种可能性ai,i=1,2,…,k,首先根据对手行为与ai的匹配程度得到一个匹配值mi,然后计算每一种可能性的概率值pi,
pi=mi/(m1+m1+…+mn)公式一
从而得到所有可能性的概率分布,也就是一个k维向量{p1,p2,…,pk},其中pi是对手的信息取ai的概率。
3.根据权利要求2所述的非完备信息博弈的策略生成方法,其特征在于,当博弈进行了多个阶段,对手的行为不止一次时,对手的信息为包括了以往的历史行为的一个列表,此时,将对手信息ai多次地与对手不同阶段的行为进行匹配,然后将多个匹配值的乘积作为公式一中的mi的值。
4.根据权利要求3所述的非完备信息的博弈策略生成方法,其特征在于,所述步骤三中,通过蒙特卡洛方法随机选择对手的一个信息,假设为ai,其中ai服从步骤二中产生的概率分布;以ai作为对手信息,并判断博弈的胜负;将蒙特卡洛方法循环若干次,即多次选取对手的信息,多次比较判断博弈胜负,从而得到博弈的胜率pwin:
pwin=countwin/countlose
其中,countwin是获胜的次数;countlose是失败的次数。
5.根据权利要求4所述的非完备信息博弈策略的生成方法,其特征在于,所述步骤四中,将步骤三中得到的胜率作为基础进行决策;
具体的,假设胜率为pwin,在当前状态下有m种行动可供选择:
{action1,action2,…actionn},对于行动actioni,如果博弈胜利的收益为payoffi,win,失败的收益为payoffi,lose,则选择收益期望值最高的行动作为最终决策actionresult,即:
Actionresult=actionr,使且x∈[0,n],有Ex≤Er
其中,Ex、Er分别是决策actionx和actionr的收益期望;对于任何决策actioni的收益期望Ei,用如下方法计算:
Ei=pwin×payoffi,win+(1-pwin)×payoffi,lose。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510491027.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





