[发明专利]一种基于异构系统集成的信息挖掘与进度预测方法有效
申请号: | 201210534639.9 | 申请日: | 2012-12-12 |
公开(公告)号: | CN103020736A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 仇原鹰;常建涛;孔宪光;邵晓东;李申;盛英;殷磊 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 西安新思维专利商标事务所有限公司 61114 | 代理人: | 李罡 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 系统集成 信息 挖掘 进度 预测 方法 | ||
1.一种基于异构系统集成的信息挖掘与进度预测方法,其特征在于:所述的方法如下:
(1)、首先连接异构系统的各个数据库,实现异构系统的集成,进而建立数据仓库;
(2)、通过数据挖掘得到相应的项目或任务进度信息;
(3)、将获取的进度信息代入多元线性回归模型,通过优化验证,得到准确的数学模型,将项目或任务的进度通过模型计算出来,
(4)、通过数据库底层技术以及C++Builder的可视化控件,将挖掘出来的进度相关数据直观的展示出来。
2.根据权利要求1所述的一种基于异构系统集成的信息挖掘与进度预测方法,其特征在于:所述的步骤(1)中建立数据仓库,其建立的步骤方法和步骤如下如下:
1)收集和分析业务需求;
2)建立数据模型和数据仓库的物理设计;
3)定义数据源;
4)选择数据仓库技术和平台;
5)从操作型数据库中抽取、净化、和转换数据到数据仓库;
6)选择访问和报表工具;
7)选择数据库连接软件;
8)选择数据分析和数据展示软件;
9)更新数据仓库。
3.根据权利要求1所述的一种基于异构系统集成的信息挖掘与进度预测方法,其特征在于:所述的步骤(2)中:
运用数据挖掘的方法,从数据集成平台上获取与项目或任务进度估算相关的数据,对比一下获取的数据是否符合要求,如果不符合要求,需要重新获取数据,如果符合要求,则建立任务自动分解模板;
数据挖掘的算法方面,采用的是关联规则挖掘的Apriori算法,步骤如下:
1)首先扫描数据库,对每个项目进行计数
2)得到第1阶段的候选项目集,并判断是否大于最小支持度
3)如果大于最小支持度,则生成第1阶段频繁项目集
4)运用Apriori-Gen算法进行运算,得到第2阶段候选项目集
5)扫描数据库,对每个项目进行计数,并判断是否大于最小支持度
6)若大于最小支持度,则生成第2阶段频繁项目集;反之,则算法结束
7)重复5)、6)步骤,生成第K+1阶段频繁项目集直至算法结束。
4.根据权利要求1所述的一种基于异构系统集成的信息挖掘与进度预测方法,其特征在于:所述的步骤(3)中,运用多元线性回归模型建立项目或进度的改进多元线性回归模型;设因变量为y,自变量为x,自变量共有p个,他们的n组观测值为:
公式(1)
写成矩阵形式为:
其中
是多元线性回归的未知参数,即回归系数,采用最小二乘法估计其值,最小二乘法是使估计值与观测值y之间的残差在所有样本点上达到最小,
公式(2)
其中,
根据微分学中求极值的原理可以得到当存在时,有,这就是的最小二乘估计,有了回归系数的最小二乘估计,就可以得到反映回归效果的5个参数,即残差平方和(q)、回归平方和(u)、F值统计量(F)、相关系数(r)和t值统计量,
公式(3)
式中,为第个样本点上的回归值,
公式(4)
式中,为的样本平均值,
公式(5)
公式(6)
公式(7)
公式(8)
其中,相关系数r表示回归方程对原有数据拟合程度的好坏,越接近1说明回归效果越好,F值统计量表示了多元线性回归方程的显著性,该值服从F分布,它们必须满足一定的显著性检验要求在回归效果较差的情况下,根据的大小采用后推法依次剔除不显著的自变量,用剩余的显著性因素再次进行回归分析,最后其回归结果就确定了项目或任务进度的预测模型。
5.根据权利要求1所述的一种基于异构系统集成的信息挖掘与进度预测方法,其特征在于:所述的步骤(4)中,通过数据库底层技术以及C++Builder的可视化控件,如DBChart_Bar、DBChart_Gantt、DBChart_Pie可以将挖掘出来的进度相关数据直观的展示出来;可视化区域通过指定Windows组件:Form、Panel、ScrollBox、PageControl的设置,使得显示出来的图形直观,易读。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210534639.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置