[发明专利]一种业务实体关系智能探索引擎实现方法在审
| 申请号: | 201710888369.4 | 申请日: | 2017-09-27 |
| 公开(公告)号: | CN107908640A | 公开(公告)日: | 2018-04-13 |
| 发明(设计)人: | 张帆;祝春捷;潘坚跃;陈超;夏霖;陈晨;李雅;泮莉莎;施婧;孔晓杭;雷云 | 申请(专利权)人: | 国网浙江省电力公司杭州供电公司;国网浙江省电力公司;国家电网公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06;G06Q10/10 |
| 代理公司: | 杭州华鼎知识产权代理事务所(普通合伙)33217 | 代理人: | 项军 |
| 地址: | 310004 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 业务 实体 关系 智能 探索 引擎 实现 方法 | ||
技术领域
本发明涉及一种探索引擎,尤其是涉及一种一种业务实体关系智能探索引擎实现方法。
背景技术
随着大数据的发展,大型企业也开始制作企业数据资产相关业务。实际上企业数据资产数据在工作过程中帮助业务终端用户快速、深入的了解业务流程、业务实体、业务规则、业务关系以及跨业务实体间衔接关系,业务实体与数据间对应关系,有效建立业务与数据的关联关系,有效提升业务和数据需求解析能力,发挥企业数据资产价值。但是在数据资产数据库建立的过程中,有可能会发生数据录入错误等问题,导致数据和业务实体无法挂钩。有一些不常用的业务实体可能要在后期才能发现问题所在,此时由于整体业务中的相互关系,导致牵一发而动全身,要更正问题都非常麻烦。
申请号:201410394069.7的发明专利《一种基于元模型拓扑的网管数据处理可视化监控方法》中公开了一种基于元模型拓扑的网管数据处理可视化监控方法,内容包括:1)通过抽取网管系统数据处理过程中涉及对象、任务的数据模型与关联,梳理网管系统涉及的IT设备模型与连接,以对象、任务与设备的归属关系为切合点,生成两级嵌套的、端到端的数据处理拓扑;2)通过检测设备运行状况、网络连通性、任务处理进程,解析任务处理日志、分析数据有效性手段,实时输出检测结果并附着于数据处理拓扑的各类对象,实现网管实时数据处理过程的直观、有效的监控手段,协助网管维护人员,实现事前问题预防、事后影响性评估与原因溯源。
这样的监控虽然比较到位,但是有时候对于稳定的业务进行连续的观察管理造成了管理资源的浪费,整体维护的消耗较大。
发明内容
本发明针对现有技术的不足,提供一种业务实体关系智能探索引擎实现方法,在业务实体过程中对业务之间进行关联,当业务出现问题时能快速理顺流程,找到问题所在,同时针对疑似易出问题的业务进行标注,提高业务的稳定性。最终处理的流程通过图像化显示。
本发明是通过以下技术方案使上述技术问题得以解决:一种业务实体关系智能探索引擎实现方法,包括以下步骤:
步骤1:梳理业务实体,业务实体代表真实世界中物资对象,每个实体用一个全局唯一确定的ID来标识;由业务人员定义目前业务上存在的业务实体,并在系统中创建该唯一业务实体,定义其属性;
步骤2.进行业务实体归一,识别业务实体间关联关系实体归一是在发现具有不同ID但却代表真实的异构数据源、信息源的业务模型中同一对象的那些数据实体,并将这些数据实体智能归并为一个具有全局唯一标识的业务实体;同时通过数据实体间的数据关联关系,自动生成业务实体间的关联关系;
步骤3.生成企业业务实体视图进行输出,通过主动监测数据表间主外键关联关系发现数据实体间的关联关系,并通过数据实体和业务实体间的关联关系动态生成业务实体间关联关系图。
优选的,业务人员定义目前业务上存在的业务实体前先收集总体业务类型,并且制作清单,所述清单中留出后续添加的业务类型ID。这样的结构避免业务增加后无法在系统中扩展的问题。
优选的,所述业务实体智能归一方法具体表现为:通过聚类算法定义合适的相似度度量,将具有相同描述的数据实体,具有相同属性的数据实体进行智能归一,对应到一个统一的业务实体;其具体步骤包括:
(1)数据实体定位:在技术人员的配合下初步定梳理并定位到该业务实体存在哪些系统、哪些数据表中,并初步建立业务实体与数据实体对应关系;
(2)生成数据集
智能探索引擎自动采集系统中其他数据表中各数据项的单值信息,并排除字段类型为数值类型的数据项,生成数据项详细信息数据集;
(3)业务实体归一
系统将字段名和字段值作为输入参数,通过聚类分析算法,自定判断具有字段值相同或类似的数据实体为同一的业务实体。
通过这样的方案使得业务实体之间不是简单的集合,而是相互之间带有关联的存在,提高了出现问题后的纠偏能力以及整体系统的稳定性。
优选的,所述数值类型包括浮点型和整型。在没有新的数值类型前,仅仅采用这两种数值类型,以保持整体数据的一致性,减少后期出现问题的可能。
优选的,所述方法通过python环境实现。Python作为一个较为成熟的平台,使用起来较为稳定,能持续支持本发明的实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力公司杭州供电公司;国网浙江省电力公司;国家电网公司,未经国网浙江省电力公司杭州供电公司;国网浙江省电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710888369.4/2.html,转载请声明来源钻瓜专利网。





