您的当前位置:首页正文

网络性能、可靠性设计

2024-08-09 来源:欧得旅游网


一. 实验目的及实验环境

学习如何设计一个具有高性能及高可靠性的网络。

二. 实验内容

设计一个具有高性能及高可靠性的网络。

三.实验步骤

网络性能设计:

网络性能设计的目标是使网络系统能够满足用户应用对网络各个方面的需求。为了避免网络建成后可能出现的各种性能问题,网络的可靠性和冗余在设计中都要考虑周到。

1. 网络的可靠性设计

(1) 抗毁性是指系统在人为破坏下的可靠性,例如部分线路或者节点失效后,系统是否能提供一定程度的服务。

(2) 生存性是在随机破坏下系统的可靠性。随机性破坏是指系统部件因为自然老化等造成的自然失效。生存性主要反映随机性破坏和网络拓扑结构对系统可靠性的影响。

(3) 有效性是一种基于业务性能的可靠性。有效性主要反映在网络信息系统的部件失效的情况下,满足业务性能要求的程度。 提高网络系统可靠性的方法,除了保证系统本身的质量和规范的管理外,网络设计中主要是设计冗余部件,即构建网络系统的备份体系,增强系统的容错能力。在信息系统中,完整的备份体系还应该包括运行环境备份、业务数据备份、备份策略和恢复方案。

2. 冗余设计

(1) 增加线路、设备、部件,形成备份

硬件容错方法之一是硬件堆积冗余,在物理级可通过元件的重复而获得(如相同元件的串、并联,四倍元件等)。另一个硬件容错的方法叫待命储备冗余。该系统中共有M+1个模块,其中只有一块处于工作状态,其余M块都处于待命接替状态。一旦工作模块出了故障,立刻切换到一个待命模块,当换上的储备模块发生故障时,又切换到另一储备模块,直到资源枯竭,显然,这种系统必须具有检错和切换的装置。混合冗余系统是堆积冗余和待命储备冗余的结合应用。当堆积冗余中有一个模块发生故障时,立刻将其切除,并代之以无故障待命模块。这种方法可达到较高的可靠性。

(2) 数据备份

数据备份的重要性在于许多数据不经常使用,这些数据长期存储在硬盘上,既占用了存储空间,又降低了存储设备的使用效率,降低了存取速度。为了能更有效地利用信息,通常把常用的信息放在联机的硬盘或磁盘阵列等设备上,组成联机的资料库,把不常用的、但有时又要检索的信息,放在联机的后备设备如磁带库、光盘库上。而大量的长时间不使用的信息,则保存在脱机介质上脱机备份。更为重要的原因是防止由于自然灾害、故意破坏、病毒、非法操作、黑客攻击、内部人员故意破坏篡改、误操作等造成联机的数据丢失。为防范风险,先将数据作备份保存,一旦发生事故,可及时调出备份,尽快恢复计算机系统的工作。 为了保证单点的数据安全性,RAID技术、镜像技术甚至双机备份也无法替代数据备份。只有能够恢复的备份才叫备份。我们必须考虑到计算机应用系统遭遇到单点突发事件或自然灾难时的情况。

保证数据安全包括两个方面。一是系统防护技术,指从桌面系统到网络环境到数据服务器的防病毒、防黑客入侵技术;二是系统保护技术,指数据备份、快速恢复、异地存放、远程控制、灾难备援等技术。数据容错的主要策略即数据备份。

按备份的策略可分为完全备份、差分备份、增量备份、按需备份。 (3) 双机容错系统

双机容错系统的一个CPU板出现故障时,其他CPU板保持继续运行,这个过程对用户是透明的,系统没有受到丝毫影响,更不会引起交易的丢失,充分保证数据的一致性和完整性。系统的容错结构能够提供系统连续运行的能力,任何单点故障不会引起系统停机,系统提供在线的维护诊断工具可在应用继续运转的情况下修复单点故障。

系统通过冗余的服务处理器统一监控系统所有设备的状态,监控服务器自身出现故障的概率可以认为是0。系统运行及处理过程中,冗余的部件都在使用,处于\"热\"状态中,可以加快交易的处理,增加带宽,提高系统处理的速度和效率。

(4) 双机热备份

双机热备份是当CPU出现故障时由闲置状态的备份系统接替,但正在处理的交易有可能丢失,从而导致数据的不一致。双机热备份系统关键部件如CPU的故障将导致主系统停止运行,对应用产生很大的影响。当发生系统故障引起停机后,恢复运行时应用需要从磁盘或磁带上重新启动,需要耗费更多的宝贵时间。双机热备份采用\"心跳线\"保持主系统与备用系统的联系,一旦\"心跳线\"部分发生故障,系统很难分清是\"心跳线\"还是系统其他部分的故障,往往需要人工干预才能解决问题,应用也将受到影响。双机热备份备用系统的硬件和软件资源处于闲置的冷状态,浪费系统资源。

(5) 三机表决系统

在三机表决系统中,3台主机同时运行,由表决器根据3台机器的运行结果进行表决,有两个以上的机器运行结果相同,则认定该结果为正确。现在三机系统中较多采用的是将双机备份和三机表决两者结合起来的方式,当三机中坏掉一台后就当作双机备份系统来用。

(6) 集群系统

均衡负载的双机或多机系统就是集群系统(Clusting)。DEC公司最早在其VAX系统上实现了集群技术。多服务器集群系统的主要目的是使用户的应用获得更高的速度、更好的平衡和通信能力,而不仅仅是数据可靠性很好的备份系统。

如图3-1所示的是一个计算机群集管理系统。3台服务器通过以太网相连,并通过SCSI电缆分别接到磁盘阵列柜上,磁盘阵列柜作为3台服务器的共享数据存储设备。

(点击查看大图)图3-1 计算机集群管理系统 在3台服务器上,分别安装了NT及Lifekeeper容错软件包。3台服务器分别作3个应

用,其中服务器A用作Sybase,服务器B用作Lotus Notes,服务器C用作Internet服务,这3个应用都安装在LEC-3808型磁盘阵列柜上。正常工作时,3台服务器分别作各自的应用,并通过网链及SCSI链相互侦测工作状态。当有一台服务器发生故障时,另外两台服务器中工作量较少的一台服务器自动接管发生故障的服务器的数据、用户及应用进程。故障服务器恢复正常后,自动恢复到初始的正常状态。

网络可靠性设计:

可靠性是指:设备在规定的条件下、在规定的时间内完成规定的功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。

1)耐久性。是指设备运行的无故障性或寿命,专业名称叫MTBF(Mean Time Between Failure),即平均无故障时间,它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。

2)容错性。专业名称叫MTTR(Mean Time to Repair),即系统平均恢复时间,是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。

3)可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题(如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。

在网络架构的设计中,充分保证整网运行的可靠性是基本原则之一。网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。

构建可靠的网络,需要从耐久性、容错性以及可维护性三个方面进行网络规划设计。而网络的规划设计是个系统工程,不同的设计方案的可靠性性效果不尽相同,这就需要以科学的方法进行设计,构建符合需要的可靠性网络。

不同的网络,其可靠性的设计目标是不同的。网络解决方案的可靠性需要根据实际需求进行设计。高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。

网络结构通常分核心层、汇聚层和接入层。网络层次越高其可靠性要求也越高。在网络的方案设计中,采用层次化的网络设计结构,不同层次解决不同级别的可靠性要求。为保证网络可靠性,可靠性技术的实施并不是简单叠加和无限制的冗余。否则,一方面会增加网络建设整体成本,另一方面还会增加管理维护的复杂度,给网络引入潜在的故障隐患。因此在进行规划时,应该根据网络结构、网络类型和网络层次,分析网络业务模型,确定基础网络拓扑,明确对网络可靠性最佳的关键节点和链路,合理规划和部署各种网络高可用技术。

在网络可靠性规划实施时,应在保证网络各层次可靠性要求的基础上,尽量降低复杂度,适度地控制成本,才能设计出最适合的方案。不能为追求单纯可靠性而忽视系统的整体成本和性能,构建可靠性网络是一个平衡各方面因素的过程。所以对于网络可靠性,没有最好的方案,只有最合适的方案。

可靠的接入层应提供以下主要特性:

使用冗余引擎和冗余电源获得系统级冗余,为关键用户群提供高可靠性; 与具备冗余系统的汇聚层进行双归属连接,获得缺省网关冗余,支持在

汇聚层的主备交换机间快速实现故障切换; 通过链路汇聚提高带宽利用率,同时降

低复杂性;

通过配置802.1X,动态ARP检查及IP源地址保护等功能增加安全性,有效防止非法访问。

汇聚层应使用与核心层相同结构的冗余节点备份连接,以实现最快速的路由收敛并避免黑洞产生。汇聚层做三层接入网关时,还需要通过VRRP等协议实现网关的冗余备份和流量的负载分担。汇聚层边界发生链路或节点故障时,收敛速度取决于缺省网关冗余与故障切换,通过合理地配置协议定时器,可达到秒级的收敛速度

核心层设备作为网络的骨干,需要能提供快速的数据交换和极高的永续性。从备份和负载分担的角度可选用双核心或多核心;从单台设备考虑,选用交换性能和可靠性高的设备,支持双主控、电源冗余、风扇冗余、分布式转发等特性。并降低核心设备配置的复杂度,减少出现错误的几率。

四.总结

高性能的重要性不必多说,不管对于什么网络来说,高性能是必须的,至少也得足以应付目前的业务,同时也要考虑到将来的扩展。网络系统的可靠性就像自然界的生态平衡,维系着系统的正常运转,一旦平衡被打破,需要具备自我恢复的能力。一个可靠的网络系统,能够保证长期的正常运转,在极低的概率情况下才出现故障。高可靠性的设备和可靠性技术(如冗余备份和虚拟)是保证以上可靠性的基础。

因篇幅问题不能全部显示,请点此查看更多更全内容