这份《行业运维标准白皮书:运维工具平台参考规范》由XX技术有限公司制定,主要围绕运维管理工具平台相关标准展开,涵盖监控告警管理、配置管理、自动化运维管理、可视化管理、工单管理、权限管理和接口管理等方面,旨在确保客户信息系统稳定运行,提升IT效能,满足业务需求。
1. 监控告警管理 - 监控管理:包括监视和控制,目的是确保IT资源或服务行为状态符合标准,是衡量服务级别和持续改进的基础。监控对象广泛,支持多种IT资源。监控系统功能涉及监视数据采集、分析、信息处理,包括多种采集方式、数据存储展示分析功能,以及对监视信息的多种处理方式。 - 告警管理:告警是配置项监控指标达阈值等情况的警告通知,产生方式有管理工具轮询和配置项自检。告警可分级,有紧急、严重、警告、提示四级。管理策略包括集中管理、权限管理、通知策略、压缩策略、屏蔽策略。告警处理涉及通知、响应、转工单和展示信息等环节。
2. 配置管理 - 对象要求:涵盖机房动环设施、物理设备、云平台资源、系统软件、应用系统等,平台应内置各类对象模型及关系。 - 功能要求:包括配置管理(支持录入查询等操作、群组管理、全文检索、配置消费、自定义属性关系)、配置审计(支持审计管理、检查、规则设置、检查未更新配置项)、版本记录(记录配置项历史版本信息)、流程管理(与运维流程联动实现配置变更审计)。
3. 自动化运维管理 - 自动化编排:作业管理支持可视化流程编排,具备多种作业编排和搜索展示功能,脚本库支持多种脚本语言,可多主机分布式并发执行作业并记录查看执行过程;脚本管理支持在线编写下发、参数配置和附件下发;流程管理支持与工单联动,提供平台信息概览、作业执行跟踪控制和全局作业总览。 - 自动化运维场景:故障自愈支持自定义编排和自动触发;自动化巡检可对资源自动巡检并生成报告;应用管理支持应用自动安装发布变更,平台有文件仓库并提供管理功能。
4. 可视化管理 - 可视化大屏:核心是呈现IT服务和资源状态及事件,帮助运维决策。内置专题有数据中心、云资源、大数据专题等,可定制开发以满足个性化需求,定制流程包括调研、UI设计、指标映射、技术评审、开发、验证和部署等步骤。 - 报表:内置部分统计报表,支持复杂场景下的自定义报表开发,包括综合分析Dashboard、拖拉拽式设计、常用模板、多种图形控件、统计算法、多种导出格式、图形表格展示和权限控制。
5. 工单管理 - 流程管理:支持流程自定义,包括环节、处理人、展现形式定义,支持多种任务分派方式、表单自定义、流程通知、定时策略、排班功能和外部触发设置,且与配置管理联动,支持服务水平管理策略设置和记录查看。 - 工单管理:常见功能如创建、提交、派发等,支持工单自动化,有工单目录方便创建,可从多方面查看工单,提供工单统计功能,以多种形式展示工单情况,便于决策和风险识别。
6. 权限管理 - 机构管理:用户可自定义机构,机构与角色和用户关联,反映组织业务管理信息,管理员可管理机构及人员信息。 - 用户管理:用户凭用户名和口令登录,具有所属机构等信息,权限为所有角色权限总和,可进行用户信息新增、维护和授权操作。 - 角色管理:角色属性包括名称、类型等,决定功能操作权限,平台预置角色类型和部分角色,支持角色扩展、查询和指定负责人。 - 授权管理:包括角色授权(可将角色授权给用户,支持删除已授权角色)和菜单授权(控制角色可操作的功能菜单),管理员可进行通知管理。 - 系统数据权限:配置数据权限区分管理员、群组成员和普通成员权限;监控数据权限根据配置项类型关联;工单数据权限按用户组区分,可设置敏感级别。
7. 接口管理 - 监控告警管理接口:提供对象数据、性能数据、告警数据上传,监控策略新增修改,告警查询统计等接口,还包括短信/邮件网关发送接口和查询相关信息接口。 - 配置管理接口:涵盖配置项属性、关系查询,配置项增删改查,消费服务相关查询等接口。 - 工单管理接口:包括工单模型查询,工单新建、查询列表、详情和状态查询等接口。 - 对接网管:通过适配器采集配置项及其关系、告警数据、性能数据,对接前需分析梳理网管相关信息并测试,需客户及供应商配合。
|