[发明专利]一种基于人工智能的数据处理方法和相关装置有效
申请号: | 201911084030.4 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110841295B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 曾子骄;张榕 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | A63F13/67 | 分类号: | A63F13/67;A63F13/822;G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 数据处理 方法 相关 装置 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取博弈场景中在第i轮博弈时的已知资源信息,所述博弈场景中具有多个参与对象,所述多个参与对象包括目标对象和待测对象,所述已知资源信息包括所述目标对象在第i轮博弈时持有的资源和通过前i-1轮所述多个参与对象已使用的资源;所述多个参与对象所持有或使用的资源为牌资源;
根据所述已知资源信息中内容的来源类型,确定多层矩阵向量;
根据所述多层矩阵向量,依据用于牌面估计的第一神经网络模型确定所述待测对象在第i轮博弈时所持有资源的第一概率分布;
根据所述第一概率分布,预测所述待测对象在第i轮博弈时持有的资源;
根据所述目标对象和所述待测对象在第i轮博弈时持有的资源,通过树搜索算法展开搜索树;
根据所述搜索树确定所述目标对象在第i轮博弈所使用资源的第二概率分布;
根据所述第二概率分布确定所述目标对象在第i轮博弈使用的资源,以得到通过牌面估计和树搜索算法确定的所述目标对象的出牌策略;
通过完成所述博弈场景所对应博弈,确定所述待测对象在第i轮博弈中实际所持有资源;
将所述实际所持有资源作为反馈,训练所述用于牌面估计的第一神经网络模型;
在使用所述第一神经网络模型进行牌面估计并使用所述树搜索算法展开搜索树的所述博弈场景的博弈过程中获取训练数据,所述训练数据包括多轮博弈对应的所述已知资源信息、所述目标对象在多轮博弈中分别使用的资源,以及所述目标对象在所述博弈场景所对应博弈中的胜负信息;
将所述目标对象在多轮博弈中分别使用的资源作为第二神经网络模型中策略网络模块的输出标签,将目标对象在所述博弈场景所对应博弈中的胜者信息作为所述第二神经网络模型中价值网络模块的输出标签,并通过所述训练数据训练所述第二神经网络模型,以将基于牌面估计的树搜索算法作为所述第二神经网络模型的强力策略改善过程;所述第二神经网络模型用于根据所述目标对象在第i轮博弈中持有的资源,确定所述目标对象在第i轮博弈中使用资源的概率分布。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取实际博弈场景中人工智能对象在第i轮博弈中持有的资源,所述实际博弈场景中的参与对象包括所述人工智能对象和用户对象;
根据所述人工智能对象在第i轮博弈时持有的资源,通过第二神经网络模型确定所述人工智能对象在第i轮博弈中所使用资源的第三概率分布;
根据所述第三概率分布确定所述人工智能对象在第i轮博弈使用的资源。
3.根据权利要求1所述的方法,其特征在于,所述已知资源信息还包括所述多个参与对象的博弈角色和资源使用顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911084030.4/1.html,转载请声明来源钻瓜专利网。