[发明专利]一种基于不确定性支持向量机的数据模型比较方法有效
申请号: | 202110237422.0 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112598340B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 余志强;陈琛;周群博;王晨;宋亮;陈振宇 | 申请(专利权)人: | 成都飞机工业(集团)有限责任公司;清华四川能源互联网研究院 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06N20/10 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 徐静 |
地址: | 610091 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 不确定性 支持 向量 数据模型 比较 方法 | ||
本发明公开了一种基于不确定性支持向量机的数据模型比较方法,通过构建高维度数据模型,将不确定性参数引入支持向量机分类模型的训练,从而提升对本体数据模型的辨识和比较效率及准确率,最终实现高效数据集成。本发明采用了支持向量机机器学习方法,开展数据本体模型的快速分类。通过引入不确定性参数,避免了数据模型由于不同部门、不同责任主体之间的管理差异和不确定因素产生噪音干扰分类模型的正常运行。本发明同时兼顾线性分类和基于核函数的非线性分类,对不同的应用场景有较强的适应性。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于不确定性支持向量机的数据模型比较方法。
背景技术
许多大型企业由于信息化规划及建设的遗留问题,过去的系统都是完全依据各个业务板块的需求来设计建设的,整体的规划较弱,没有考虑是否与其它系统的功能或数据存在重复的问题,而且各个系统由不同的厂商和产品搭建,导致存在各业务部门数据模型不统一,部门之间数据定义矛盾或者相互混淆的情况,影响部门间及不同系统间数据交换,导致数据共享比较困难。在企业数据集成建设的工作中,传统上是基于人工对照的方式,对不同系统的数据模型进行比较判断,成本居高不下,无法应对越来越复杂的业务集成要求。因此,迫切需要一种更加快速高效的方式,对不同业务域的数据模型定义进行自动比较。
发明内容
为了解决上述问题,本发明提出一种基于不确定性支持向量机的数据模型比较方法,通过构建高维度数据模型,将不确定性参数引入支持向量机分类模型的训练,从而提升对本体数据模型的辨识和比较效率及准确率,最终实现高效数据集成。
本发明的一种基于不确定性支持向量机的数据模型比较方法,包括以下步骤:
S1. 收集流程数据,通过构建数据流图,以业务处理过程为中心,描述完整的业务和数据流程;所述数据流图能够根据需要进行分层绘制;
S2. 提取所述数据流图信息,获得包括数据来源、数据消费者、模型负责人、所属部门和/或考核绩效在内的业务信息;
S3. 构建包括多个特征值的高维度数据模型,所有特征值均伴随一个不确定性参数,用以表达可能存在的无法准确获取该特征值的情况;将特征值与其对应的不确定性参数组合,形成
S4. 进行本体数据模型识别,形成训练数据集标签;
S5. 基于本体数据模型识别结果,运用支持向量机分类模型进行训练和验证;
S6. 运用训练完成的支持向量机分类模型进行本体数据模型分类,将划分为同类的结果进行确认,确认后对本体数据模型中的不同项目进行统一修改,为系统集成和逻辑模型关联提供支撑。
进一步的,步骤S1中,业务和数据流程的核心组成部分为业务活动和数据流向,包括:
数据输入,即为当前业务活动所需的、来源于上游业务活动的信息;
数据输出,即为当前业务活动产生的或改变的信息,供下游业务活动使用;
当前业务活动的所有者、责任人或部门信息;
当前业务活动的管理控制信息,包括当前业务活动所对应的绩效KPI。
进一步的,步骤S2中,所涉及的流程和相关部门设定有唯一的流程ID和部门ID,以确保沿所有数据流方向上,尽可能多的ID都是递增的;同时,参考数据定义、数据管理部门的相关数据信息,将流程与数据信息结合,协同构建高维度数据模型。
进一步的,步骤S3中,所述特征值包括数据存量、数据增量、更新频率、数据来源、数据流向、数据所有者、所属部门、绩效指标、命名、编码和/或数据类型。
进一步的,步骤S3中,不确定性参数的计算方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都飞机工业(集团)有限责任公司;清华四川能源互联网研究院,未经成都飞机工业(集团)有限责任公司;清华四川能源互联网研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110237422.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理