运维管理:寻求真正的“主动”之路
尽管网络运维的管理技术在不断进步,但事实上,众多网络工程师并没有从日常的维护工作中得到真正意义上的解脱,究其原因而言并不复杂:“虽然已经能够获取网络设备、服务器、网络流量,甚至数据库的警告信息,但成千条警告信息堆积在一起更本没法判断问题的根源在哪里?”“虽有业内厂商提供了产品和解决方案告警过滤和压,但结果却并非尽人意”。面对这样的抱怨,难道我们的工程师将永远无法走出“被动的怪圈”吗?
如今,在网络管理领域中,“主动”并不是一个十分前沿的理念,从被动到主动管理的升华是每个企业针对信息系统如何提高IT服务水平、如何提高系统可用性、降低运维成本,实现IT科学性的过程。很多企业在选择IT管理工具时将最终目标就定位在“主动”,希望业务系统能够“无忧”,但真正能够达成IT与业务融合的企业却是很少。很多IT运维厂商都强调,“传统被动式”的类似“救火员”角色的IT系统运维方式,根本不能适应目前需求,那么企业到底怎样才能实现真正的“主动”呢?
为何丧失了“主动”的先机?
在虚拟化、云计算等新兴技术的推动下,网络运维正在走向一种整合的发展趋势。有些网络工程师习惯于将工作重心放在性能而不是质量上,放在提供支持而不是消除问题上。在这种工作思路的前提下,网络运维故障的发生也就必然的,但未能根据业务进行基础监控的终端,将丧失在问题造成业务中断之前,就进行防止的契机,也就丧失了“主动”的条件。
“主动”怎样落到实处?
网络架构就像企业的经络一样,渗透到企业运营上的各个环节,低效率的网络系统致使企业运营面临陷入瘫痪的可能;从另一方面也折射出企业网络架构和IT部门的战略地位和作用。因此,越来越多的企业希望深度利用网络技术这一关键的战略资源提供对关键业务的支持,提升公司的竞争优势,进而实现公司运营的战略目标。然而由于今天的网络架构面临着诸如日益增长的基础设施复杂性、技能方面的限制以及资金短缺等相当多的问题,事实上要做到这一点并非轻而易举。
如上所述,如果在IT系统中没有出现问题,也就没有告警信息,但这是不可能存在的一种假设。当所有的业务系统集中起来的时候,出现无数的警告信息实际上是非常正常的,这就如人生病一样,很多疾病都会造成身体上多处特征的不良反应,医生会开出多得让你厌恶的检查表格让你检查,实际上这就是瞧病过程中找到病源的过程。但这个过程越长,你就越加无法忍受。企业的业务系统也是如此,在问题出现时,不能将问题迅速归类,不能发现最具特征的表象,也就迟迟无法做出问题改善,“主动”也就失去了意义。
主动运维的管理新思维
脱离每天被繁冗的警告和报表所包围的现状,利用“主动管理”高效而清晰地描述业务系统的运行状况,立即把所有的警告信息繁为简,一目了然。网络运维管理所能够提供的就是追踪问题改善状况的评估方式,以便达成持续的改进成果,这才是“主动运维管理”的内涵。
当你迅速地解决网络故障,端起一杯咖啡时,那是一种技术水准和管理境界的显现,工作就是享受成就,也许正是网络运维管理中关于“主动管理”一词最直接、最具说服力的诠释。
2009年专业研究机构Gartner的一组全球调研数据显现,网络运维管理已当仁不让地成为企业CIO最关心的首要问题。应用网络的整体运维质量正成为企业核心价值中越来越重要的组成部分,企业运营和网络运维正在形成一种前所未有的密切关系,网络运维的管理战略与企业的核心战略、业务战略、服务战略相辅相成;所以,网络在凝聚了巨大的财富的同时,更意味着积聚着巨大的潜在风险,这也使得每一位企业的CIO无不压力重重。
企业的运营对网络应用的依赖性越来越强,网络特别是骨干网络的稳定健康运行直接关系到日常业务的正常运营。对骨干网络的流量分析;对潜在应用隐患提前预警;对各种发生的故障进行及时定位、分析、处理;在此基础上合理利用网络资源;根据应用现状和发展趋势进行网络规划;保障网络安全、高效、稳定的运行就变得日趋重要。面对各类纷繁复杂的网络运维管理问题,简单的封堵不仅起不到预期的管理效果,反而会适得其反,进一步恶化正常的应用效能。
过去,我们在应对网络运维管理时,采取的是消极式的被动维护,但现实证明,这种办法已经是越来越力不从心。应用管理进入广域网络时代之后,主动服务的管理思维,实际上来自于我们在网络运维管理中的失利,主要表现为是时间赛跑上的失利。
由此可见,仅仅依靠补丁和堆积各种产品来维护网络的运营,显然已经不足以应付当今的网络威胁。而“主动管理”,就是唯一的出路。从宏观面看,主动模式的运维管理的网络运维系统应该尽可能减少人工干预,就能管理各种已知和未知的威胁,同时,运维管理参与并覆盖整个网络系统,从终端设备到各种应用服务,并能及时相互响应。
应用:幕后的主角 运维为应用而生
网络运维管理的根本出发点和任务,就是维护网络应用,失去应用,运维也就没有了存在的意义。因此,对于网络运维系统的判定原则也非常简单,那就是,只有提升应用效能的运维管理,才是真正意义上的网络运维管理。
在十年前的企业网络并没有运维管理设备时,并没有感到如何的管理需求,而现在,在部署了设备之后,这种“不安感”却与日俱增,究其原因就在于,应用网络已经成为企业经营与发展的命脉,企业的网络应用越多,对网络的依赖性越强,对网络运维管理
主动运维的管理新思维
的需求就会越为强烈,因此,从这个投入产出的层次来讲,运维管理甚至和网络应用的快速发展成为了一种矛盾。
网络运维管理实际上就是一个过程管理,而不是一种状态管理,因为,绝对完美的应用效能系统是不存在的,不远的将来也不可能出现。调研数据显示绝大多数企业已经放弃了“一劳永逸”、“一步到位”的管理思维,明白了所谓网络运维管理,就是一个渐进的过程,只有一条道路,那就是掌握运维管理的主动权;说到底,企业最关心的并不是一个完美的,无懈可击的网络,而是如何保证网络所承载业务的持续、稳定、可靠地运行。
运维管理:永不会画上的句号
在过去的几年中,大部分的企业倾其所能的安装了主机管理产品、行为管理产品、网元管理产品、流控设备和SNMP管理产品等应用管理产品,相关的资金和人力投入也在不断上升,但运维问题和事故不是越来越少,而是越来越多了。这也给了我们另一个提示:今天的网络运维,需要的不是越堆越多的技术和产品,而是一条全新运维管理的新思路;这已是一个不争的事实。
正因如此,有形的管理产品的意义越来越被淡化,企业需要的是一个已经“效能化”的网络,企业的网络管理从“被动管理”向“主动服务”过渡,即企业从发现问题后再修补的“产品叠加型”消极方式向“以运维管理”为核心的主动服务方式过渡;网络运维管理平台从“孤立的产品形式”向“集中化管理平台”过渡。因此,不管是从市场、技术还是从产品、应用等层面来看,目前都是网络管理产业释放“主动运维”的能量的最佳时期。
所以,虽然我们面对的应用网络存在这种那样潜在的运维管理缺陷,只要我们通过适合灵活的主动运维管理策略,确保企业运营和商业数据的可靠,并确保企业应用效能的持续性和稳定性,那么承载企业运营的这个网络对于该企业来说就是符合要求的应用网络。当然,在现有的条件下,国内企业要在短期内实现这一目标,从资金和技术角度来看都尚需时日,但是这并不重要,重要的是,这已经为我们给出了一条全新的运维管理思路,我们可以在这一原则之下,更灵活地掌握和控制。追求运维效能是一个不断奋斗,永无止境的过程,乾脉网络也将随之前行,永远不会画上一个终止符。
因篇幅问题不能全部显示,请点此查看更多更全内容