[发明专利]一种数据处理方法、装置及电子设备在审
| 申请号: | 201710498713.9 | 申请日: | 2017-06-26 |
| 公开(公告)号: | CN107341548A | 公开(公告)日: | 2017-11-10 |
| 发明(设计)人: | 刘创 | 申请(专利权)人: | 北京深度奇点科技有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 北京市广友专利事务所有限责任公司11237 | 代理人: | 祁献民 |
| 地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 电子设备 | ||
1.一种数据处理方法,其特征在于,包括:
设置目标对象的数据运行规则;
选取与所述目标对象的数据运行规则匹配的包含特征平面的训练数据集;
基于所述目标对象规则和战术对应的感受野范围,确定所述目标对象的策略网络结构,使所述策略网络结构的卷积核大小与卷积层个数的组合满足所述感受野范围的要求;
利用所述训练数据集训练所述目标对象的策略网络。
2.根据权利要求1所述的数据处理方法,其特征在于:
目标对象的数据运行规则为无禁手运行规则或有禁手运行规则。
3.根据权利要求1所述的数据处理方法,其特征在于,所述选取与所述目标对象的数据运行规则匹配的包含特征平面的训练数据集,包括:
判断所述目标对象的数据运行规则为无禁手或有禁手;
若为无禁手则选取无禁手训练数据集;
若为有禁手则选取有禁手训练数据集;
判断所述训练数据集中是否包含非常规训练数据;
若是,则进一步获取所述非常规训练数据在所述训练数据集中的比例;
当所述非常规训练数据在所述训练数据集中的比例小于预设阈值时,认定所述训练数据集为合法数据集。
4.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
获取所述特征平面的尺寸b;
构建二值化、大小为b×b的特征平面;
将所述训练数据集中的训练数据转化成所述特征平面。
5.根据权利要求1所述的数据处理方法,其特征在于,所述基于所述目标对象规则和战术对应的感受野范围,确定所述目标对象的策略网络结构,包括:
采用较大的卷积核和较少的卷积层来构建所述策略网络。
6.根据权利要求1所述的数据处理方法,其特征在于,所述基于所述目标对象规则和战术对应的感受野范围,确定所述目标对象的策略网络结构,包括:
采用较小的卷积核和较多的卷积层来构建所述策略网络。
7.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
当所述训练数据集中存在脱先的数据时,扩大所述感受野的范围。
8.根据权利要求1所述的数据处理方法,其特征在于,所述利用所述训练数据集训练所述目标对象的策略网络,包括:
选择NLL为损失函数,以所述训练数据集中的落子动作作为分类标签;
通过设置学习率、学习率衰减以及收敛条件,对所述目标对象的策略网络进行训练。
9.一种数据处理装置,其特征在于,包括:
设置模块,用于设置目标对象的数据运行规则;
选取模块,用于选取与所述目标对象的数据运行规则匹配的包含特征平面的训练数据集;
确定模块,用于基于所述目标对象规则和战术对应的感受野范围,确定所述目标对象的策略网络结构,使所述策略网络结构的卷积核大小与卷积层个数的组合满足所述感受野范围的要求;
训练模块,用于利用所述训练数据集训练所述目标对象的策略网络。
10.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述任一权利要求1-8所述的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深度奇点科技有限公司,未经北京深度奇点科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710498713.9/1.html,转载请声明来源钻瓜专利网。





