[发明专利]一种路径相似度分析方法以及系统在审
| 申请号: | 201410705903.X | 申请日: | 2014-11-27 |
| 公开(公告)号: | CN104462288A | 公开(公告)日: | 2015-03-25 |
| 发明(设计)人: | 谢羽 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 路径 相似 分析 方法 以及 系统 | ||
技术领域
本发明涉及信息处理领域,尤其涉及的是一种路径相似度分析方法以及系统。
背景技术
存储业务中,由于数据所经过的模块或函数不同,因此存在多种不同的I/O路径。典型的如在cache命中的情况下,数据直接从cache模块返回;cache不命中数据会继续流向下层模块,这是两类不同的I/O路径。由于系统开发的连续性,存储系统不同版本之间的不同IO路径往往存在一定对应关系,如在同样的工作场景下,基线版本和后续版本(也称问题版本)的IO路径可能由于添加某一函数而导致不同,经验上认为这两类IO路径之间存在对应关系,基线IO路径突变为问题IO路径,也称为结构突变。
固定的业务场景(如存储系统)下,请求的处理路径(如读写IO的路径)是固定的,性能变化能够追溯到请求处理路径的变化(如读IO cache命中率下降导致IO路径变长,性能相应下降)。通过分析请求路径的变化是分析性能变化的有效手段。路径变化主要有两种,1,时延突变:基准IO路径同问题IO路径结构相同,但是对应模块间的时延有明显差别;2,结构突变:基准IO路径同问题IO路径结构不同;对于2,在基准数据和问题数据中,需要在多对多的可能突变数据中计算最大可能对应关系。对于对应关系的寻找,目前没有普遍认可的方法存在。
目前业界广泛使用的IO路径跟踪工具有Google dapper,X-Trace等。Dapper是一种分布式跟踪系统,可以跟踪服务器集群之间的请求调用路径。以Dapper为例,简要说明该类跟踪工具原理:
Dapper可以跟踪用户的请求所经过的路径上各个节点的信息,如时间戳。Dapper利用应用程序或中间件给每条请求记录一个全局标志,借此将路径串接为一条完整回路。Dapper每条跟踪记录服务的开始时间和结束时间,每个模块的ID和父ID,没有父ID的模块为root模块,所有跟踪公用一个跟踪ID,通过跟踪ID将这些记录串接为一条IO请求路径。X-Trace作为互联网主机跟踪工具,其原理同dapper类似。统一存储系统中也有采用同样原理的跟踪工具。
这些跟踪工具都是跟踪某一时间点或时间段的IO路径,如基线版本的稳定IO路径,问题版本的问题IO路径。对于不同时间段的IO路径的突变关系问题无法解决,而且由于IO路径不同层级之间的不同对系统的影响是不同的,上层IO的不同反映版本之间的较大差异,而下层的IO不同可能只是版本之间的微小差异造成,现有技术忽略该类差异,对IO的不同进行统一计算,相似度识别可靠性不高,容易造成结构突变对应关系误判,导致分析结果误差较大。
发明内容
本发明实施例提供了一种路径相似度分析方法以及系统。
本发明实施例第一方面提供了一种路径相似度分析方法,包括:
分别获取基准数据的第一树形数据和问题数据的第二树形数据;
根据相同的遍历规则以及各节点之间的隶属关系对所述第一树形数据和所述第二树形数据的各节点进行遍历以获取各节点的深度值,各节点的所述深度值用于表示各节点在所述第一树形数据或第二树形数据中所位于的层次;
分别根据所述第一树形数据和所述第二树形数据的各节点的深度值确定第一集合和第二集合,其中,所述第一集合包括多个分别与所述深度值对应的第一子集,且各所述第一子集内的所述第一树形数据的节点的深度值相同,所述第二集合包括多个分别与所述深度值对应的第二子集,且各所述第二子集内的所述第二树形数据的节点的深度值相同;
根据与各所述第一子集和与各所述第二子集对应的深度值计算所述基准数据和所述问题数据的相似度权值。
结合本发明实施例的第一方面,本发明实施例的第一方面的第一种实现方式中,
所述根据与各所述第一子集和与各所述第二子集对应的深度值计算所述基准数据和所述问题数据的相似度权值之前,所述方法还包括:
确定与所述第一子集对应的各深度值的最大值以及确定与所述第二子集对应的各深度值的最大值;
确定与所述第一子集对应的各深度值的最大值和与所述第二子集对应的各深度值的最大值中的较小值为第一基准深度值;
确定与所述第一子集对应的各深度值的最大值和与所述第二子集对应的各深度值的最大值中的较大值为第二基准深度值;
确定初始化相似度权值W等于0;
确定目标节点个数为c,其中,所述c等于各所述第一子集和各所述第二子集内的节点数的最大值。
结合本发明实施例的第一方面的第一种实现方式,本发明实施例的第一方面的第二种实现方式中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410705903.X/2.html,转载请声明来源钻瓜专利网。





