[发明专利]用于IT系统应用考评拓展平台的数据分层抽样方法无效
申请号: | 201110099703.0 | 申请日: | 2011-04-20 |
公开(公告)号: | CN102147893A | 公开(公告)日: | 2011-08-10 |
发明(设计)人: | 胡思国;李永红;李军 | 申请(专利权)人: | 重庆市电力公司綦南供电局 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q50/00;G06F17/30 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 江雪 |
地址: | 401420 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于IT系统应用考评拓展平台的数据分层抽样方法,包括分层步骤和抽样步骤,能够快速有效地对现有的数据表中的记录进行分层,便于进一步抽样,其分层和抽样性算法体现出每类记录在抽样记录中的作用与它在原数据表中的作用相当,满足了对各类记录进行评价的覆盖性要求。 | ||
搜索关键词: | 用于 it 系统 应用 考评 拓展 平台 数据 分层抽样 方法 | ||
【主权项】:
1.用于IT系统应用考评拓展平台的数据分层抽样万法,其特征在于:包括分层步骤和抽样步骤,所述分层步骤包括:1)从数据库中读取数据表;2)以其中一个字段为依据,通过对比,对数据表中的记录进行分层或分类:设该字段属性值分别为:t1,t2,Λ,ts,数据表中记录总数为m,每条记录(1-m)对应该字段的属性值分别为:k1,k2,Λ,km,则可以建立函数f:{k1,k2,Λ,km}α{t1,t2,Λ,ts};于是,当f(ki)=t1(i=1,2,Λ m),取出该字段的属性值ki所对应的所有记录,若记录数不为零,则得到第一个类p1,记录数为m1;在剩余的记录中,当f(ki)=t2(i=1,2,Λm-m1),取出该字段的属性值ki所对应的所有记录,若记录数不为零,则得到第二个类p2,记录数为m2;依此类推,可以得到最终的分类结果;3)设最终分类结果为:p1,p2,Λ,pn,共n类,且每类对应的记录数分别为:m1,m2,Λ,mn,因此总记录数为m=m1+m2+Λ+mn,于是得到每类占总记录数的百分比,即权值:w 1 = m 1 m , w 2 = m 2 m , Λ w n = m n m ; ]]> 4)以两个字段为依据,通过对比,对记录进行分层或分类:设这两个字段属性值分别为:t1,t2,Λ,
知q1,q2,Λ,
数据表中记录总数为m,每条记录(1-m)对应这两个字段的属性值可表示向量形式为:(ki1,ki2);其中i=1,2,Λ,m,且![]()
则可以得到所有记录对于这两个字段属性值的矩阵:K = k 11 , k 22 k 21 , k 22 K K k m 1 , k m 2 , = k 1 k 2 K k m ]]> 其中ki=(ki1,ki2),i=1,2,Λ,m;于是,当ki=(ki1,ki2)=(t1,q1),i=1,2,Λ,m,取出ki所对应的所有记录,若记录数不为零,则得到第一个类p1,记录数为m1;在剩余的记录中,当ki=(ki1,ki2)=(t1,q2),i=1,2,Λ,m-m1,取出ki所对应的所有记录,若记录数不为零,则得到第二个类p2,记录数为m2;依此类推,可以得到最终的分类结果;5)设最终分类结果为:p1,p2,Λ,pn共n类,且每类对应的记录数分别为:m1,m2,Λ,mn,因此总记录数m=m1+m2+Λ+mn,于是得到每类占总记录数的百分比(权值):w 1 = m 1 m , w 2 = m 2 m , Λ w n = m n m ; ]]> 所述抽样步骤包括:设需从总记录中随机抽取P条记录,pi既表示类,也表示该类的数目,按四舍五入取整,则:p1类中抽取记录数:p 1 = w 1 p = m 1 p m ]]> p2类中抽取记录数:p 2 = w 2 p = m 2 p m ]]> ΛΛΛΛΛΛΛΛΛΛΛΛΛΛΛΛpn类中抽取记录数:p n = w n p = m n p m ]]> 最最终的抽样条数P=p1+p2+p3+..........+pn。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆市电力公司綦南供电局,未经重庆市电力公司綦南供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110099703.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种传染病医院病床用清扫吸尘器具
- 下一篇:一种擦拭玻璃的装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理