[发明专利]一种基于点阵收缩的产区天气数据融合方法有效
申请号: | 201711317380.1 | 申请日: | 2017-12-12 |
公开(公告)号: | CN108038505B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 彭伟民;陈爱红;陈婧;徐海涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 点阵 收缩 产区 天气 数据 融合 方法 | ||
1.一种基于点阵收缩的产区天气数据融合方法,其特征在于该方法包括如下步骤:
1)基于相邻位和量子表示的点阵收缩
对于源产区天气数据集X=[s1,s2,…,si,…,sn]T中的数据样本si,其中的数据元素来自L个不同的数据向量X1,X2,…,Xj,…,XL;L由产区天气属性个数决定;这里,X1,X2,…,Xj,…,XL分别表示如下产区天气属性:平均最大气温、平均最小气温、历史最大气温、历史最小气温、周平均气温、周气温偏差、周累计降雨量、周降雨量偏差、24小时最大降雨量、月累计降雨量、年累计降雨量、平均最大相对湿度、平均最小相对湿度、气温高于90°F天数、气温低于32°F天数、降雨量大于0.01英寸天数、降雨量大于0.5英寸天数;
定义数据样本si为一周记录一次数据样本,产区天气数据集X包含某产区15年以上数据样本记录;若数据向量Xj中的数据元素具有mj个唯一取值,则数据元素被量子化成含有mj个量子位的量子态,即其中,只有一个量子位等于|1,该量子位的上标与在mj个唯一取值顺序序列中的位序一致;当所有数据向量中唯一取值数m1,m2,…,mj,…,mL确定之后,数据样本si被量子化成具有M个量子位的量子态;显然,每个量子化样本中有L个量子位等于|1;点阵结构通过将量子化样本分布于全|0量子态|00…0…00和全|1量子态|11…1…11之间进行构造;
点阵结构第一层只有一个含M个量子位|0的结点且拥有M个孩子结点,第二层中每个结点拥有M-1个孩子结点且有一个量子位等于|1,第三层中每个结点含拥有M-2个孩子结点且有两个量子位等于|1,其他层的情况可依此类推;第(M/2+1)层拥有的点阵结点数最多;而含有L个量子位|1的量子化样本位于第L+1层;以数据样本|si为例,阐述基于相邻位的渐进式点阵收缩过程;
数据样本si的量子表示|si由其包含的L个数据元素的量子表示组成;而含有mj个量子位的量子化元素具有如下表示:
其中,量子位等于|0或|1;定义量子化数据样本|si为:
由于样本|si的表达式由它包含的元素的表达式组成,因而将|si的收缩分解为所包含的元素的收缩;两个量子位和的收缩,可以通过受控操作来实现;具体来说,量子位和被当作非联合受控位,量子位|0被当作目标位;若或等于|1,则将X-门作用于目标量子位|0;当一个数据向量中特定的属性值达到给定的阈值,此向量中数据元素的收缩结束;
设定如下不等式作为基于相邻位的点阵收缩阈值;
其中,frj表示第j个数据向量在第r轮点阵收缩包含的唯一数据元素的个数;若满足不等式(3),则继续点阵收缩过程,否则终止点阵收缩过程;即当唯一数据元素减少的速度小于点阵结点长度缩短速度时,点阵收缩过程才继续;
2)基于相邻位和经典表示的点阵收缩
基于相邻位和经典表示的点阵收缩原理与基于相邻位和量子表示的点阵收缩原理类似;将量子态替换成二进制态,则可获得经典的点阵结构,每个点阵结点包含M个二进制位;与两个量子位的收缩相比,两个二进制位的收缩可以通过逻辑或运算实现;由于点阵结点的收缩将导致一个数据向量中相似数据元素的聚合,因此一个数据向量中数据元素之间的差异在经过一轮收缩后扩大了;基于此,向量方差被当作收缩阈值的关键因子,它能够反映向量中结点之间的离散情况;
其中,表示第j个数据向量在第r轮点阵收缩的方差;即若向量方差保持增长,则继续点阵收缩过程;
3)基于量子的重复检测与数据融合
根据公式(1)所示的数据元素的量子表示,数据元素中量子位的上标1,2,kj,…,mj表示所有唯一取值的序列编号;在的收缩过程中,各量子位的上标保持不变;即经过一轮收缩之后,的收缩结果中量子位的上标值来自于中量子位的上标值;
为方便起见,数据元素经过r轮收缩之后的结果设为并具有如下定义形式:
其中,的情况可依此类推;对于中的量子位,只有一个量子位等于|1,将此量子位称为极点量子位并假设等于|1;随着向量中量子数据元素的收缩,两个数据元素中极点量子位之间的上标差距变得更小了;下面,以量子态|xi1和|xi2为例,展示两个极点量子位之间上标差距的变化;其中,且|xi1和|xi2的上标序列为{1,2,…,8,…,15,16};
显然,|xi1和|xi2的极点量子位为和收缩前,和之间的上标差距等于经过一轮收缩之后,|xi1和|xi2变为和|xi1′和|xi2′的上标序列为{1,3,5,7,9,11,13,15};|xi1′和|xi2′的极点量子位为和且经过一轮收缩后和之间的上标差距等于遵循同样的方式,|xi1′和|xi2′经过两轮收缩之后变为:和|xi1″和|xi2″的上标序列为{1,5,9,13},其中的极点量子位为和经过两轮收缩之后和之间的上标差距等于
极点量子位之间上标差距的变化表明,随着向量中数据元素的收缩,极点量子位之间上标差距保持减小,且r轮收缩后的减小量不小于r;为此,对于重复检测标准的设定,主要考虑上标差距的减小量和同一数据样本中数据元素的不同收缩轮数;设数据样本|si的收缩结果为|sirdt的极点量子位为则由|sirdt中数据元素的极点量子位组成;
重复检测标准定义为:
其中,rj为第j个数据向量中数据元素的收缩轮数;若数据样本|si和|si′满足不等式(7),则它们是一个子集上的重复数据;根据的定义,可将表达式转换成:
重复检测标准具有如下表示形式:
当一个子集中所有重复数据样本被确定之后,它们将被融合成一个单一的目标数据样本;对于一个子集中的源数据样本来说,需要统计每个向量中所有数据元素的观测概率;一个向量中具有最大观测概率的数据元素将被选作此向量的目标数据元素;以数据子集sst中数据样本|st1,…,的融合为例,展示基于量子的数据融合模型;其中,nt表示子集sst中数据样本个数;若源数据集被划分成T个子集,则n1+…+nt+…+nT=n;
数据样本|st1,…,的融合可被分解成不同数据向量中数据元素的融合;设目标数据样本为|st,它代表了子集sst中源数据样本的融合结果;|st中目标数据元素为源数据样本|st1,…,中源数据元素的融合结果,且等于具有最大观测概率的源数据元素,即:其中,为数据元素的观测概率;若将表示成max(ptj),则:
在公式(10)中,k=1,…,ht,…,nt;
4)经典的重复检测与数据融合
对于经典的数据融合模型,关注焦点是融合结果的包容性;即,一个目标数据元素包含了所有相关的源数据元素的成分;以子集sst中数据样本st1,…,为例,展示经典的数据融合模型;其中,以子集sst中源数据样本对应的目标数据样本为st,且对于数据向量Xj中源数据元素对应的目标数据元素的计算,一种简单的方式就是采用加权平均策略;
其中,为的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711317380.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种填充密封膜的保温墙体
- 下一篇:一种甲醇汽油添加剂及其制备方法与应用