mydream2007v 发表于 2012-11-8 15:05:25

看集中运维管理系统项目如何成功

背景随着杭州电信业务的快速发展,杭州电信的网络和应用系统规模和数量也日趋扩大。目前,杭州电信的信息系统上有CISCO、华为等网络设备共500余台,IBM、HP等主机设备共200余台,此外还有大量的ORACLE、SYBASE数据库和应用系统等共同支撑着杭州电信的各种业务的正常开展。由于网络管理和系统管理上的问题难以避免,给杭州电信的运维工作带来很大挑战,为此,杭州电信需要建立一个功能完善、技术先进、使用方便的集中运维管理系统以满足日益增长的管理和维护要求,适应网络向集中管理、集中维护方向发展的目的,进一步提高运营质量,为业务的发展保驾护航。 需求分析针对杭州电信复杂的网络特性与很高的运维管理应用需求,必须建立起一个权责分明、完善合理的集中运维管理系统,并还要保证整体系统的高效性与实时性。具体的需求有如下几方面: lIT基础设施对运维管理人员的透明化,其主要目的是保证网络能够无故障的运行,做到“事前管理”,实现防患于未然,确保整个信息网络的高效、可靠和安全的运行,为杭电业务系统提供更加高效和可靠的服务。l实现杭电信息服务管理的透明化,将运维支撑部门与业务部门更好的结合,保证运维支撑部门为业务部门提供高质量的服务。l需要定期进行网络巡检,现有的人工操作方式不能满足对大量网络资源的同步监测,数据实时性不强,工作量巨大并且不能满足7×24的运维要求。 项目介绍结合杭州电信网络运维的实际情况,我公司在ITManager网络运维管理平台的基础上,建设了一套多级运行保障的网络运维管理平台,系统清晰地描述杭州电信各级管理系统的管理边界、管理权限和管理接口,通过健全的管理手段实现了丰富的运行管理功能。本次ITManager系统具体的部署方案如下:l关键业务监控:通过ITManager对网上的业务系统状态动态监控,通过拓扑管理状态图显示、设备状态树闪烁、事件实时监控等展示业务的运行状态和故障状态,并对业务相关的网络设备、链路、主机和应用的详细性能情况进行监控和记录,在确保整个业务系统运行安全的情况下,对整个业务系统进行综合评价,找出业务响应不够及时的根本原因及解决方法。l详细运维报表分析:根据历史数据记录,形成网络运行日报表、周报及月报,并通过报表任务制定实现网络自动巡检并生成巡检报告,系统还能将各种网络设备、链路、主机、应用等的巡检报告发送到各自管理人员的邮箱。l自动配置备份:ITManager实现对杭州电信的各种不同类型的网络设备的配置文件进行手动和自动下载,同时系统还能够对配置文件进行配置比较和归档等操作,一旦网络设备配置出现异常能够通过配置导入快速进行恢复从而保证网络的高可用性。l环境参数管理:提供核心网络设备的电源、电压、温度和风扇等状态的管理。l主动故障告警和定位,事前运维:通过故障管理定位和丰富的告警类型,成功实现“事前运维管理”,处理各种事件由被动变为主动,系统还提供详尽的SYSLOG和TRAP解析,同时在故障处理时还能够无缝集成带外运维工具,提高故障响应和处理的及时性。 项目价值分析杭州电信通过ITManager网络运维管理平台的部署能够灵活地满足网络运营的要求,实现对多业务、多厂商、多技术的运维操作功能,从而达到以下目的: l通过对IT基础设施的管理和完善的业务保障手段提升了核心竞争力,区别自己与竞争对手。l提高整体工作效率,降低企业运营成本并保护现有IT投资。l增强对IT环境的控制能力,集中精力发展业务,赶在竞争对手之前不断地推出新业务。

尜尜 发表于 2012-11-8 17:10:59

可以看一些类似堡垒主机的方案做参考。但不能解决介绍中提到的环境参数的管理。

墨迹天涯 发表于 2012-11-8 17:19:17

分享了

liujinmin999 发表于 2012-11-12 15:40:59

分享;P
页: [1]
查看完整版本: 看集中运维管理系统项目如何成功