[发明专利]一种提高容错服务器应用层级容错性能的方法有效

专利信息
申请号: 201110321691.1 申请日: 2011-10-21
公开(公告)号: CN102404139A 公开(公告)日: 2012-04-04
发明(设计)人: 王友升 申请(专利权)人: 浪潮电子信息产业股份有限公司
主分类号: H04L12/24 分类号: H04L12/24;H04L29/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 250014 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 提高 容错 服务器 应用 层级 性能 方法
【权利要求书】:

1.一种提高容错服务器应用层级容错性能的方法, 其特征在于包括自动检测与恢复模块、远程恢复模块、日志转储恢复模块,通过在操作系统内核中加入容错架构来提高应用层级服务器的容错性能,容错架构是由三级串行容错模块组成,故障由操作集的自检测机制进行检测,然后通过自恢复模块进行自恢复过程,自恢复不成功才将故障交给远程恢复容错模块处理,远程恢复失效后,交给日志容错模块进行本地日志的的前滚,为了解决部分硬件故障问题,引入了PB机制、IP组播技术和日志技术,实现无缝整合计算机硬件和应用层,克服了软硬件脱离和脱节的问题,提高系统的灵活性和可移植性:

具体步骤如下;

首先通过用户接口向应用层提供访问文件系统的能力,然后内核层接口依赖下层模块提供的系统调用的内核实现逻辑,内核接口层由文件系统的操作集构成,当系统正常工作时,系统调用和操作集交互,实现应用程序的功能,一旦操作失败,需要判定是否发生了故障,如果发生故障,交给三级并行容错模块处理;

应用层根据故障的特点和原因进行分析,然后调用三级容错模块中的第一级自检测与恢复模块,把故障进行隔离,隔离故障进程是通过故障处理器和故障内存将操作迁移到容错服务器中正常的硬件上工作,然后进行软件层面的恢复;如果是硬件故障或者是自检测恢复成功,则系统恢复结束;

如果是自检测与恢复模块恢复失败,则系统调用第二级容错模块远程实时恢复,在远程实时恢复过程中,故障节点机器首先会利用IP组播技术检测临近节点的B备份,利用B备份,通过通信模块进行拷贝恢复,同时保证各备份之间的一致性,如果二级容错模块恢复成功,则容错恢复停止,否则继续进行三级容错日志转储恢复;

在日志转储恢复中,我们通过利用操作系统的日志功能来记录系统运行过程中的数据改变,来进行系统的前滚和后退来达到容错服务器容错恢复的目的,如果通过自检测与恢复、异己恢复和日志恢复完成故障恢复,并将结果保存,返回内核接口,这样保证容错服务器恢复过程中对用户的透明。

2.根据权利要求1所述的方法,其特征在于,三级容错模块的容错逻辑执行步骤如下:

应用层接口发出读写指令,操作集模块进行读写分离,如果是读操作,则选取一个有效的副本,然后读成功;如果是写操作,同步所有副本,如果同步所有副本失败,服务器首先在本地进行屏蔽错误,然后自检恢复,一旦恢复失败,它会进行异己容错,如果异己容错失败,系统将进行日志容错,然后恢复成功,系统恢复成功后,然后同步所有的副本,完成写操作,容错恢复成功。

3.根据权利要求1所述的方法,其特征在于,提高容错服务器应用层级容错性能设计时,利用PB机制,客户端访问时根据负载均衡算法定位到ServerA中,此时ServerA中的会话信息称为P备份,然后在集群内的ServerB和ServerC上分别形成一个该次访问的备份,称为B备份,一旦访问过程中,ServerA出现故障,那么应用层会切出P故障,然后对ServerB和ServerC中的B备份进行一致性检查,检查通过时,并根据算法选择其中一个B备份作为P备份为客户端提供服务器,然后被隔离的P备份故障进行自我检测并利用当前的P备份,形成一个B备份,通过这样一个逻辑设计从而实现应用层的容错。

4.根据权利要求3所述的方法,其特征在于,PB机制是由多个独立的失效服务器实现服务进程和通信的,每个服务器都有一个服务进程拷贝,PB机制要求满足三个条件:一是当拷贝发生故障时,所有的其他拷贝能侦测出故障拷贝;二是当拷贝故障发生时有一个替代的拷贝,并且确保拷贝状态保持一致;三是只允许客户端与P拷贝进行交互。

5.根据权利要求1所述的方法,其特征在于,应用层高端容错体系结构设计,采用一种松散的服务器耦合结构,集群内的每个服务器是独立的,即使有一个服务器出现停机故障,其他服务器也可以独立接收请求,每个服务器定期查其他看服务器消息来维护集群内的其他成员列表,每隔几秒服务器向其他的成员发送消息以告知其他成员该服务器仍在起作用,消息的发送利用可靠的IP组播技术来实现,当集群内的服务器数量增大时,该方法能保持较高的效率和可扩展性,如果一个服务器连续三次收不到某个服务器发送的消息,则服务器将把收不到消息的那台机器排除在集群之外,利用这种可靠的IP组播技术进行查看,从而使集群能够动态添加删除服务器而又不影响现存服务器配置。

6.根据权利要求1所述的方法,其特征在于,应用层级容错可靠性验证步骤如下:

根据马尔科夫状态图假设基于集群的高端容错体系结构模型在运行过程中经历如下七状态,假设是三个服务器构成的集群:

p0:三个服务器均处于正常状态;

p1:系统处于写进程容错状态;

p2:系统处于读进程容错状态;

p3:一个服务器永久失效,系统处于双机活动状态中;

p4:两个服务器处于永久失效状态,系统处于单机状态下;

p5:整个系统全部失效状态;

根据马尔科夫状态图处理问题的方法知,系统的可靠度为:R(t)=1-P77(t),在解状态方程时,写进程失效率为0.0005,读进程失效率为0.0001,我们发现在一定区间上通过提高容错服务器应用层级容错性能的设计模型的可靠度远大于单纯硬件容余和存在单点故障的设计模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110321691.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top