[发明专利]一种基于生成对抗网络的指挥信息系统数据生成方法在审
| 申请号: | 202010724100.4 | 申请日: | 2020-07-24 |
| 公开(公告)号: | CN111897809A | 公开(公告)日: | 2020-11-06 |
| 发明(设计)人: | 田相轩;石志强;张建军;吕莹 | 申请(专利权)人: | 中国人民解放军陆军装甲兵学院 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06N3/04;G06N3/08;G06Q10/06;G10L15/22 |
| 代理公司: | 上海思牛达专利代理事务所(特殊普通合伙) 31355 | 代理人: | 丁剑 |
| 地址: | 100072 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 生成 对抗 网络 指挥 信息系统 数据 方法 | ||
1.一种基于生成对抗网络的指挥信息系统数据生成方法,其特征在于,包括以下步骤:
获取并进行清洗指挥信息系统运行过程中产生的数据,按照信息类型区分为结构化信息和非结构化信息两部分,对数据进行预处理;
进行拟合度作为GAN系统的判别模型目标函数的修正因子,实现生成的模拟数据集与原始数据集的数据分布的快速拟合,进行实现数据的学习、训练和生成。
2.根据权利要求1所述的基于生成对抗网络的指挥信息系统数据生成方法,其特征在于,所述数据进行预处理,包括以下步骤:
区分短报文、长报文、语音信息后,将长报文、语音信息转换为短报文集的形式,其中,包括长报文进行短语识别转换为短报文集和语音信息进行语音识别;
对获取的短报文集进行信息提取,包括获取短报文语义,并对短报文进行数据映射,建立短报文信息与编码之间的对应关系集;
将处理完的非结构化信息与结构化信息进行数据清洗,包括将同一时刻的多维度信息转换成为表征指挥信息系统技战术指标的时间切片信息。
3.根据权利要求1所述的基于生成对抗网络的指挥信息系统数据生成方法,其特征在于,进一步包括以下步骤:
固定生成模型,训练判别模型,其判别模型的函数表示为:
maxV(D,G)=Ex[logD(x)]+Ez[log(1―D(x)]
固定判别模型,训练生成模型,生成模型的目标是使得生成的数据集使判别模型无法判别,其目标函数表示为:
minV(D,G)=Ez[log(1―D(G(z)))]
定义判别模型和生成模型的优化方法;
每迭代n次进行数据分布拟合度校验,修正判别模型的目标函数,从而提高向原始数据拟合的收敛度,其修正函数表示为:
SIN*(Ex[logD(x)]+Ez[log(1―D(G(z)))])
其中,N=round(M/n),round()为取整函数,M为目前的迭代总次数,SIN为第N轮的拟合度值。
4.根据权利要求3所述的基于生成对抗网络的指挥信息系统数据生成方法,其特征在于,所述原始数据拟合的收敛度,包括以下步骤:
迭代生成的模拟数据集,选取任意两个随机变量X,Y,使其分布在两维的空间中,使用m*n的网格进行空间划分,对落在各个网格的点数进行统计;
计算落在第(x,y)网格的频率P(x,y),同时计算落在在第x行的数据点的频率作为P(x)地估计,同理获得P(y)的估计,表示为:
通过遍历,改变m,n的值,变化网格的划分,寻找使得a,b落在第(x,y)网格中的频率的各种可能,获得互信息最大的网格划分参数,即随机变量X,Y的互信息值,其中m*nB,B=f(datasize)=n0.6,表示为:
获取任意模拟数据集中任意两个随机变量的互信息值,通过归一化,使互信息的值分布在(0,1)区间内,构建互信息邻接矩阵;
确定本轮与原始数据互信息邻接矩阵之间的互信息值,得本轮数据集相似度SIN,设计第N轮的拟合度为S为第N轮与第N―1轮相似度的比值,若第N轮相似度高于第N―1轮的相似度,则增强该方向梯度下降的信心,否则降低向该方向梯度下降的信心,表示为:
SIN=f(Matrix(MIC)N,Matrix(MIC)base);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军装甲兵学院,未经中国人民解放军陆军装甲兵学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010724100.4/1.html,转载请声明来源钻瓜专利网。





