本帖最后由 monicazhang 于 2015-11-12 16:44 编辑
20151112 淡然 续上
6.1 集中展现平台 集中展现portal统一将原始信息、告警信息、故障信息、性能、安全事件实时趋势分析、安全事件风险情况、安全现状报告等进行展示,同时在后台可配置需要显示的内容。并通过实现Portal门户功能,实现各系统的统一一次登录SSO,实现用户登录系统的一次登录认证管理,减少重复认证成本,实现统一的数据呈现功能。 ITSS培训 集中展现Portal提供一个图形化的显示界面,使得系统的展现可以通过统一平台进行实现。具体提供统一大屏幕输出显示、仪表盘指标、各流程运维数据、监控数据、趋势预警分析、系统维护、权限管理、报表管理、审计管理等功能。 集中展现Portal的展现方式有两种: 1. 系统具备集中展现:展现平台是根据分析过滤后进行显示,是集中监控系统与用户服务人员的交互界面,将实时的故障、性能、安全事件通过图形等不同的展现方式显示,不同用户可登陆到各自管理页面。 2. 在门户系统中展现:通过与某公司的相关门户系统集成,实现不同的用户权限显示对应的故障、性能和安全事件等信息。
6.2 运维管理平台6.2.1 供应商管理 支持某公司信息中心在运维管理平台上对供应商信息、供应商绩效等相关内容进行管理。 供应商信息管理 提供供应商信息管理,主要包括服务商的简介、主营业务、服务内容、服务评价级别、联系人、联系方式、驻场服务人员架构和技能等。可对供应商信息进行添加,更改,删除等操作。 供应商绩效管理 主要定期提供对供应商服务质量的评价。可以根据定义好的KPI指标,调用服务台数据生成相应报表,实现对供应商的绩效管理。 如:对供应商的平均响应时间,解决问题所花时间,解决问题成功率等指标进行加权,对供应商进行评估,将其分为金服务、银服务、铜服务级别。 初步的IT服务绩效管理评价内容包括: 1) 工作量评估 对服务人员工作量进行评估,如处理的事件总数、平均响应时间,解决问题所花时间,解决问题成功率等指标进行加权评测。 2) 工作质量评估 对各供应商工作质量进行评估,如变更发布执行效果、事件复发率、客户满意度等指标进行加权评测。
服务合同管理 主要提供相应的服务合同的管理。包括服务项目名称、合同签订时间、合同终止时间、合同内容间接、合同详细内容链接等。系统可以手工增加、删除、修改服务商的基本信息和附加信息,可以按照服务商名称、合同号、部分合同名称、日期等字段进行查询。
6.2.2 发布管理 信息系统补丁发布控制是信息中心运维工作之一。该模块不仅要能支持某公司各系统的补丁发布,还须支持主机、网络设备等硬件升级工作的管控。 基本要求 1) 发布提交 a. 支持变更单与发布单的关联,可以是多对多的关系。 b. 可根据管理需要自定义发布表单和字段。 c. 可以灵活定义发布的分级和分类标准。 d. 工单页面可以插入文档、图片和VSS和CVS超链接。 e. 针对发布包中的补丁说明,系统可以插入文档,也可以提供类似Excel的表格对象进行说明。 ITSS认证 2) 发布评审 a. 在进行发布影响分析时,能通过关联配置项信息支撑发布方案的制定。尤其是针对应用软件发布时,能良好的展示应用系统各模块之间的关系,以避免因影响分析不足而导致发布引发新的事件。 b. 发布管理模块支持通知功能,使相关的人员知晓发布相关信息; c. 具备发布等级和发布审批路径配置功能,能将发布申请单分派到相应的人员,进行评估和授权等,未经授权的发布申请单不能得到实施; d. 支持发布申请单的联合审批和逐级审批; e. 支持由当前评审人员临时选择下一评审人员,可灵活设置用户的多级领导作为流程中的评审角色。
3) 发布公告 a. 支持发布前公告和发布后公告。且发布评审授权后,系统可将公告内容按指定方式自动发布。 b. 公告可以分为两条线:一条线面对系统用户,讲解发布内容和影响及需用户配合的动作;另一条先面对信息部门,从技术角度详细讲解变更内容和影响范围,以便信息部门能及时和清楚回应用户可能提出的关于发布的请求与咨询。 c. 如果需要相关人员配合发布(例如需要监控系统停止监控发布对象)时,发布评审授权后,系统可将相关信息推送给相关人员。 4) 发布验证 a. 发布结束后,系统自动发送相关信息到对应验证人员进行系统验证。 5) 发布关闭 a. 当发布完成后,对应的变更单、事件或问题单应当自动或手动随之关闭。 b. 支持发布效果评分,并能产生相应统计报表。 发布成功后,系统能够根据变更单的描述推送配置项信息更改信息至配置管理模块。
6.3 运维相关工具6.3.1 主机监控 主机管理对服务器硬件、操作系统、集群进行统一管理,主要为主机系统管理员服务。包括:硬件管理、性能管理、文件系统管理、运行日志管理 主机性能和事件管理 Ø 同时支持SNMP和Agent方式对主机性能进行监控。 Ø CPU性能管理:能够监视系统CPU的利用率,并针对系统的每个CPU分别给出其相应的利用率;能够显示出用于系统调用占CPU时间利用率的百分比及用户调用占CPU时间利用率的百分比。 Ø 内存使用情况管理:能够监视系统内存的利用率;能够显示各种进程的内存的使用情况;能够监视系统内存中换入、换出数据的情况,当系统内存的换入、换出出现异常时能够发送消息到系统管理控制台,并能指示出导致异常的进程。 Ø 硬盘利用情况管理:能够监控硬盘及磁盘阵列的使用率;能够监控用于文件读或写操作的磁盘I/O利用率以及虚拟内存的使用率。 Ø 进程管理: a. 能够实时监视系统进程的运行状况,并能在系统进程出现异常时给出告警; b. 能够针对进程表显示出进程所占用系统资源的情况; c. 能够监控每个进程占用的内存空间; d. 能够对长时间占用CPU的进程进行告警。 e. 监控应用系统进程的运行状态,能够在应用系统进程出现异常时给出告警,并能在主要应用系统的进程终止时给予自动重启该进程的操作,同时发送告警到控制台。 f. 监控应用进程的子进程数和应用进程的执行权限。 g. 对关键进程占用系统资源的情况进行管理。 h. 能够对应用进程的启停做出相应的记录。 Ø 网络性能管理:能够实时显示主机系统网络适配器的输入包、输出包、冲突及错误的情况以及其网络流量的情况。 Ø 性能管理:能够监控系统资源的实时变化,可设置门限值,当正监测的系统性能参数达到门限时产生报警,并能够生成系统资源的历史性能报表。 Ø 主机文件系统管理: a. 文件系统空间的管理:能够实时监视文件系统空间的使用情况,并在文件系统达到一定的阈值时给出告警。 b. 对系统中的重要文件进行管理:能够监视重要文件的存在、文件的大小变化情况、内容变化情况。 c. 能够监视文件系统的挂载情况,出现不能正常挂载文件系统时给出告警。 ITSS考试 Ø 主机系统运行日志管理: 能够根据策略采集,存储和自动分析系统日志内容,判断系统中的重要错误、警告以及性能等问题,并给出相应的告警。
主机系统及其外设故障管理需求 Ø 对主机系统及其外设的硬件故障能够通过对其相应的故障日志的分析,做出及时的告警
|