[发明专利]共享存储式集群文件系统节点通信的监控方法及监控节点在审
| 申请号: | 201510793859.7 | 申请日: | 2015-11-18 |
| 公开(公告)号: | CN106713398A | 公开(公告)日: | 2017-05-24 |
| 发明(设计)人: | 郭旭艳 | 申请(专利权)人: | 中兴通讯股份有限公司 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24;H04L12/26 |
| 代理公司: | 北京银龙知识产权代理有限公司11243 | 代理人: | 许静,安利霞 |
| 地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 共享 存储 集群 文件系统 节点 通信 监控 方法 | ||
技术领域
本发明涉及共享存储式文件系统集群通信领域,尤其涉及一种共享存储式集群文件系统节点通信的监控方法及监控节点。
背景技术
如图1-图6所示,共享存储式集群文件系统节点间通信模块采用corosync(Corosync是集群管理套件的一部分,它在传递信息的时候可以通过一个简单的配置文件来定义信息传递的方式和协议等),其底层通信实现依据totem协议,通过组播的方式传递节点信息,并以单播token的形式确保消息的可靠接收,实现集群内节点变化的同步。
在组播消息丢失时,会通过token循环识别并重播,直至丢失消息节点收到该消息或者token循环次数达到最大值,Safe Order要求广播的消息每个节点的都要收到对于应用需要广播的消息才会转发应用处理,对于有Safe Order的要求的消息接收失败会引发不断的重播,引起消息处理延时。且Operational状态是集群稳定的工作状态,具有稳定的ring,而Gather,Commit态是集群判断节点状态的过程,通过反复广播自身成员,直到各节点成员均达到一致状态,对于被确认为leave的节点,集群还需要隔离这个问题节点,这个过程可能需要很长的时间,而且这个过程集群不会处理应用的消息,这样的状态会导致集群的消息处理延迟以及集群不稳定性增加,存在不能实时了解集群文件系统运行状态,难以及时对运行状态做出调控的问题。
随着共享存储式集群文件系统中集群规模的增大,会导致时延增加,存在不能动态调整集群节点的参数来适应业务量的需要的问题,难以根据实际情况调整发挥自身优势。
发明内容
为了克服上述问题,本发明提供共享存储式集群文件系统节点通信的监控方法及监控节点来解决共享存储式集群文件系统中存在的不能实时了解集群文件系统运行状态,难以及时对运行状态做出调控的问题。
为了解决上述技术问题,本发明实施例采用如下技术方案:
一种共享存储式集群文件系统节点通信的监控方法,应用于共享存储式集群文件系统中的监控节点,包括:接收所述集群文件系统中集群节点的组播消息,所述监控节点与所述集群节点都位于所述集群文件系统中;获取所述组播消息的消息类型及与所述消息类型相对应的消息参数;根据所述消息参数,查询存储表中与所述组播消息相对应的存储记录;在一预设时间间隔到达时,根据所述存储表中与所述组播消息相对应的存储记录,获取所述集群文件系统的问题节点和集群状态。
可选地,所述获取所述组播消息的消息类型及与所述消息类型相对应的消息参数,具体包括:获取所述组播消息的消息类型;当所述消息类型为应用层消息类型时,获取所述组播消息的第一消息参数,所述第一消息参数至少包括:所述组播消息对应的应用层消息的消息编号、组播所述组播消息的节点所在的第一环的第一环标号和组播所述组播消息的节点在所述第一环中的第一发送者地址;当所述消息类型为节点加入消息类型时,获取所述组播消息的第二消息参数,所述第二消息参数至少包括:组播所述组播消息的节点所在的第二环的第二环标号、组播所述组播消息的节点在所述第二环中的第二发送者地址和组播所述组播消息的节点自身记录的节点成员列表。
可选地,所述根据所述消息参数,查询存储表中与所述组播消息相对应的存储记录,具体包括:当所述组播消息为应用层消息类型时,根据所述消息编号及所述第一环标号,判断所述存储表的应用层消息表中是否存在具有所述消息编号及所述第一环标号的第一存储记录;当所述应用层消息表中不存在所述第一存储记录时,存储所述组播消息的第一消息参数至所述应用层消息表;当所述应用层消息表中存在所述第一存储记录时,判断结果为所述第一环中与所述第一发送者地址相对应的节点的上一节点存在消息丢失,得出所述上一节点为疑似问题节点,并存储所述疑似问题节点的参数至所述存储表中的疑似问题节点表。
可选地,所述得出所述上一节点为疑似问题节点,并存储所述疑似问题节点的参数至所述存储表中的疑似问题节点表,具体包括:根据所述第一发送者地址,获取所述疑似问题节点在所述第一环中的第一节点地址;根据所述第一节点地址、所述消息编号及所述第一环标号,判断所述疑似问题节点表中是否存在具有所述第一节点地址、所述消息编号及所述第一环标号的第二存储记录;当所述疑似问题节点表中存在所述第二存储记录时,增加所述疑似问题节点的消息记录次数;当所述疑似问题节点表中不存在所述第二存储记录时,存储包括所述第一节点地址、所述消息编号及所述第一环标号的第一参数至所述疑似问题节点表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510793859.7/2.html,转载请声明来源钻瓜专利网。





