×

扫描二维码登录本站

标签: 暂无标签
IT运维与IT运营在业界一直缺乏明确的界定,但初步的认知却至关重要。在国内的IT领域内,无论是过去还是现在,一些组织常将IT部门视为后端服务部门,即那些专注于与机器交互的群体。基于这种观念,将IT部门中与机器直接相关的工作命名为IT运维,而负责IT系统运行与维护的部门也自然而然地承担起了这一职责,这一做法并无不妥。


IT运维与IT运营又哪些区别?


而IT运营,实则蕴含了运行与经营的双重意义。在经营层面,它要求我们不仅要与人打交道,还需深切关注人的感受(即含义度),同时兼顾环境因素、市场竞争态势,以及追求效率和效益的最大化。


这个定义中有两个重要的假设前提
1)IT运维与IT运营不同
2)IT运营,作为IT运维的进阶形态,其职责范畴较运维更为广泛。基于这一理解,我们深入探究IT运维与IT运营之间的微妙差异。

IT运维与IT运营均至关重要,运维实为运营之基石。任何组织皆需先确保生存,进而追求卓越。这两者实为IT Operations发展的不同阶段,当今IT运维部门的工作范畴已广泛涵盖本文所述的IT运营内容。

首先,IT运维与IT运营在英文中均译为IT Operations,对外国友人而言,二者并无显著差异,均指代IT运行相关的所有事务。而中文之所以存在两种不同译法,乃因IT Operations内涵丰富,两种译法分别聚焦于其不同面向。简而言之,IT运维管理侧重于“生存”的维系,而IT运营管理则追求更高层次的目标——不仅要“生存”,更要“繁荣”。

以某大型数据中心为例,其IT服务能力愿景设定为“以业务为核心,提供稳定、安全、高效的IT运营服务,打造业界领先的IT运营能力,支撑企业持续发展与战略成功”。在此愿景中,“稳定、安全”即为解决生存问题之关键,隶属于传统IT运维管理的范畴;而“以业务为核心”、“高效”、“业界领先”则旨在探索如何“繁荣”,更多涉及IT运营管理的精髓。

能力建设是一个逐步深入、循序渐进的过程。对于任何组织而言,首要任务是解决基本的“生存”问题,随后方能追求“繁荣发展”。在过去的三十年里,众多IT组织面临着IT设施规模急剧扩大、IT应用数量持续增长以及IT运行压力日益加剧的严峻挑战。在此情境下,确保IT系统“生存”下来,即实现持续“运行”与稳定“运转”,成为了首要任务。

通过日常“维护”工作的精心实施,力求减少系统故障的发生,并在故障发生时能够迅速进行“修复”,以“保持”系统的正常“运作”。在这一阶段,将IT Operations译为IT运维,以及将ITOM译为IT运维管理,是恰当且符合行业实践的做法。

IT运维管理阶段的核心关键词为“稳定”、“安全”与“可靠”,这些要素共同构成了运维工作的基石。在关注焦点上,我们尤为重视可用性指标,包括MTTR(平均修复时间)、MTTF(平均无故障时间)以及MTBF(平均故障间隔时间)等关键参数,它们直接反映了系统的稳定性和可靠性。

同时,可靠性指标如RTO(恢复时间目标)和RPO(恢复点目标)也是我们不可忽视的重要考量,它们关乎到在故障发生时,系统能够多快地恢复到正常状态,以及能够恢复多少丢失的数据,从而确保业务连续性和数据安全性。

在人员配置、技术应用、工具选择以及流程设计上,我们都将“稳定”、“安全”与“可靠”作为首要且持续的考量因素。通过不断优化这些方面,我们致力于提升IT运维的整体效能,确保系统能够稳定、安全、可靠地运行,为企业的业务发展提供坚实的支撑。

人员配置:人员配置上,我们倾向于增加技术人员及一线故障解决人员的数量,旨在通过提升人员规模来加快故障处理及服务响应的速度。同时,人员的分工将按技术领域进一步细化,期望在每个领域内都能培养出专家级人才,以实现故障的快速响应与高效解决。
技术应用:在技术领域,我们倾向于选择稳定且成熟的技术架构与产品,不惜以高昂的成本来提升系统的可靠性。具体而言,若条件允许,我们会优先考虑部署小型机,甚至不惜代价购置大型机以满足需求。同时,我们注重数据的备份与冗余设计,力求在每一个可能出现风险的环节都进行充分的备份,并尽量采用全冗余架构来保障系统的稳定运行。
流程设计:在流程方面,我们首当其冲地聚焦于事件管理与变更管理,核心目标是确保故障事件能够得到有效追踪并迅速解决,同时严格控制变更流程,以防止人为因素导致故障的频发。我们的核心关注点仍在于不断优化和提升系统的可用性。
工具选择:工具层面,我们采用了“监控-管理-控制”的架构体系。其中,“监控”环节聚焦于设备级的细致监测,旨在精准识别并定位故障节点;“管理”则侧重于协同实现变更与事件处理的顺畅流程;而“控制”部分,则是通过引入自动化配置工具,着重于实现配置的标准化与合规性检查,其核心目标在于增强系统的可靠性,减少故障发生,而非单纯减轻运维人员的工作负担。


在历经多年以“生存”为核心导向,以“稳定”为基石的IT运维及IT运维管理发展历程后,众多IT组织正逐步跨越基本生存需求的门槛,从“被动维持”的桎梏中挣脱,迈向“主动经营”的新纪元,致力于探索如何“活得更加精彩”。近年来,APM、BSM、云计算、运维大数据、可观测性等新兴理念、尖端技术及高效工具的涌现、演进与革新,无不紧密关联于IT领域正悄然从运维向运营转型的深刻变革。时至今日,从全局视野审视,企业IT已赫然屹立于从运维迈向运营的关键转折点上。

IT运营是根植于坚实的IT运维基础之上的,缺乏这一基石,“生存”尚难,“繁荣”更无从谈起。那么,何为“繁荣”的IT运营呢?简而言之,IT运营所追求的终极目标是什么?相较于IT运维,IT运营究竟增添了哪些关键要素?与IT运维主要聚焦于基础设施维护不同,IT运营则更加侧重于业务导向、服务导向,其本质在于以人为本。谈及个人生活的质量,我们通常如何评判?广为接受的马斯洛需求层次理论指出,在基本生存需求与安全需求得到满足后,个体追求的是社会认同与自我实现。同理,对于CIO而言,若其领导下的IT组织能够赢得三类关键人群的认可,我们便可断言该组织已跨越了基础的IT运维阶段,迈向了IT运营的新纪元,步入了“繁荣”的境地。那么,这三类关键人群究竟是谁呢?

IT运营核心要义:致力于实现“用户、领导及IT从业者”的全面满意


用户、老板与IT人员。假若将IT组织视作一个独立运营的企业,那么这三者分别对应着客户、股东及员工。若CIO身兼公司领袖之职,定能深刻体会到:三者皆非轻易可得罪的群体。客户的不满将导致客源流失,进而动摇企业的生存根基;股东的不满可能引发人事更迭,折射出企业竞争力的不足;而员工的不满则可能促使他们另谋高就,削弱企业持续发展的动力。
诚然,行业特性与企业文化的差异会促使企业在处理这三者关系时,设定不同的优先级与侧重点。然而,从根本上讲,一个具备长远发展潜力的卓越企业,必然是那些能够成功赢得客户、股东与员工三方满意的企业。

IT运维阶段,IT组织主要聚焦于满足三类人群的基本需求:确保用户能够顺畅使用系统,争取老板的资金支持,以及激励员工高效工作。同时,我们也致力于提升各方的满意度,但受限于当前阶段的能力和多方面因素,能够首先保障这些基础需求的实现已属不易。而达成这一目标,在相当长一段时间内,已足以支撑组织的稳定运营。这主要归因于以下几个关键因素:

各企业在信息化初期,若能成功运用信息技术(IT)来优化、固化和自动化其业务及管理流程,便已达成初步目标。
初期系统主要面向内部员工用户,且因缺乏同类系统的对比参照,用户对系统效率和体验展现出较高的容忍度;
IT部门在企业内部对于IT能力的供给通常占据主导地位,用户往往缺乏其他备选方案。

尽管过去IT部门所提供的服务仅能满足基本需求,且在多数情况下并未引发显著问题,然而,随着近十年来互联网与移动互联网的迅猛发展,其浪潮已席卷全球每一个角落。如今,每日依赖微信、滴滴、淘宝、携程等应用的用户们,其需求与期望已大幅提升,那些过去或许能被容忍的小瑕疵,现已变得难以忍受。

为什么人家的网站运行如此迅速,而为何别人的网站响应如此迅速,而我们的系统却像老僧入定,鼠标一点仿佛需要等待漫长的时间才有反应?轻点竟需漫长等待,仿佛一炷香的时间才见动静?

人家网站首次使用,无人指导我便独立完成了所有操作,然而咱们的系统,即便经过多次培训,我依然感到困惑,不清楚如何正确使用?

我们的网站设计精美,令人赏心悦目,尽显高端大气;相比之下,为何我们的系统总是显得如此低端、不够出色呢?

为何其他网站提供免费无限容量的邮箱,而我们却需花费不菲,且每人邮件的收发还被限制在10M以内?

不知从何时起,那些曾与企业IT领域毫无关联的“外来者”突然崭露头角,悄然成为了IT部门的潜在竞争对手。他们虽未直接夺走用户,却悄然降低了用户的满意度。更令人担忧的是,随着云计算领域内各类aaS服务的迅猛发展,这些“外来者”未来极有可能真正侵蚀用户市场。

前阵子《居然之家:全面裁撤IT部门,包括CTO在内》的报道虽可能有所夸大,但它无疑传递出了一种数字化建设新趋势的强烈信号。倘若IT部门不能紧跟时代步伐,仅仅满足于基础运维的层面,而不积极向追求卓越的运营方向迈进,提供更具竞争力和高品质的IT服务,那么在未来几年内,它们很可能会面临更为严峻的挑战。

在IT运营阶段,与IT运维阶段所强调的“稳定”、“安全”、“可靠”等关键词有所不同,该阶段的核心关注点转变为“体验”、“效率”以及“效益”。回顾我们之前提及的某大型数据中心的愿景,其中“以业务为中心”与“高效”作为两大运营关键词,实质上,“以业务为中心”即是以用户为核心,因为业务的核心正是围绕用户需求展开,而用户最为重视的便是体验(当然,稳定与可靠也是体验不可或缺的一部分)。至于“高效”,它则涵盖了高效率与高效益两层含义:一方面聚焦于敏捷性,包括交付速度与响应速度的提升;另一方面则关注成本收益与服务获取效率的优化。

(如果说IT运维的核心是“稳”,那么IT运营则侧重于“敏”。在技术架构的甄选、IT管理流程与系统的构建上,IT运营阶段相较于传统的IT运维阶段,其关注焦点已发生显著转变,这导致了新旧架构、新旧工具、新旧方法并存甚至相互交织的复杂局面。Gartner所倡导的Bimodal模式,以及联想提出的双态IT概念,均是对这一现状的深刻反映。)

让我们聚焦于三类人群的需求,简要探讨IT运营相较于IT运维阶段所遭遇的新挑战,以及为应对这些挑战而涌现的新理念、工具和技术。

IT运营:让用户满意

用户大致有两类,个人用户和业务部门:

个人用户:无论是内部用户还是外部用户,其首要关注点均在于体验,这具体涵盖了易用性、容错性以及响应速度三个方面。为了提升用户体验,IT运营管理领域面临着新的要求与挑战。在原有设备和组件监控的基础上,我们需进一步增强端到端的用户体验感知能力,深化应用性能的探测与分析,以及加强对应用及系统性能瓶颈的发现与优化能力。

日益增多的IT组织正聚焦用户体验,为此积极部署了多元化的应用性能管理(APM)工具与手段,涵盖外部模拟仿真探测/用户拨测、流量数据分析、日志深度剖析以及嵌码采集探测等,这一系列举措极大地推动了APM市场在近年来的热度急剧攀升。

这些APM工具,尽管采用多种手段且功能有所重叠,但各自独具特色与重点。部署多种此类工具能够极大地丰富数据和功能,对于精准测量与提升客户体验而言至关重要。在那些高度重视用户体验的IT组织中,已经或正积极部署全方位的工具,并努力在各类专业分析工具间构建运营大数据桥梁,以实现数据的集成、统一可视化与深度整合分析。此举不仅强化了故障与优化点的定位分析能力,还深刻促进了用户体验的全面优化。
业务部门:可观测性建设及AIOps等IT运维工具的发展趋势,在某种程度上,亦被视为提升用户体验的有效途径。业务部门在关注最终用户体验的同时,更将焦点置于交付效率之上。相应地,IT部门正积极在各个环节采纳新架构、新技术与新工具,旨在全方位提升效率,加速业务服务的交付进程。
提高采购流程及硬件上架效率:IaaS云与资源池模式革新了传统按需采购模式,借助资源整合的力量,将资源规划与准备环节提前并批量化处理,从而极大地加速了预算制定、采购执行及硬件上架的整个过程。
提升系统部署与应用发布更新的效率:利用多样化的云管理工具、云管理平台及DevOps工具,借助自动化部署、配置管理等关键功能模块的集成,无论是从系统架构的横向层面,还是从应用发布与运行链的纵向维度,亦或两者协同工作,均显著提升了应用组件乃至整个业务系统的交付与发布效率。此举确保了对业务部门交付需求的迅速乃至即时响应,实现了“敏捷”级别的操作效率。


IT运营:让老板满意


让用户满意是赢得老板认可的根本前提,试想若业务部门频繁向老板反映问题,那么无论如何也难以获得老板的满意。然而,即便业务部门对你赞不绝口,老板就一定会满意吗?若你持此观点,或许说明你对老板的期望与考量还缺乏深入的理解。

老板所追求的不仅是最终成果,更包含实现过程中的高效率和高效益。面对相同的成果,我们能否探索出成本更低的达成路径?审视我们当前的成本收益状况,与业界同行相比,我们是显得“慷慨解囊”还是“精打细算”?谈及“业界领先”,其标准何在?难道仅凭技术更新与应用的频次就能断言领先吗?显然,我们还需要从效益的角度出发,建立一套衡量体系。试想,若IT部门作为一个自负盈亏的实体存在,作为投资方的股东,同样会提出这些关键问题。

效益的核心在于投资回报率,即成本越低,效益自然越佳,所从事的活动越具价值,效益则更为显著。为追求高效益,首要挑战在于构建一套完善的成本收益衡量体系。缺乏量化手段,我们难以明确IT部门在业界中的位置,也无法通过指标考核来激励其持续提升效益。
在体系尚未健全之时,我们不得不依赖一些粗略甚至主观的评估方法,如观察每年的IT采购总额、IT员工数量、工业标准产品的采购单价等。然而,这种做法往往导致IT部门在采购时过分追求同行业最低价,而当所有企业都采取相同策略时,其效果自然大打折扣。
更为关键的是,鉴于各企业在业务及IT服务领域的独特性,这些粗略指标难以真实反映IT部门的运作效率和实际效益。因此,建立一套科学、合理的成本收益衡量体系,对于提升IT部门的效益水平具有至关重要的作用。

ITIL体系早已引入了IT服务财务管理的理念,众多IT组织在过去十年间纷纷探索了ITFM(IT财务管理)、TBM(技术业务管理)以及专注于云成本管理的FinOps等项目。这些尝试的核心驱动力在于构建一个有效的IT效益评估体系。然而,尽管有这样的努力,能够在内部IT部门中成功实施并见成效的却寥寥无几。这背后的原因主要有两方面:一是IT部门往往被繁重的基础运维工作所占据,难以抽身专注于此;二是缺乏特别成功且可复制的最佳实践作为指导。

不过,随着各界持续的努力与探索,以及近年来IT架构的飞速演进和公有云的蓬勃兴起,一些领先的IT部门已率先洞察到构建IT效益衡量体系的潜力,并开始在特定的架构层级上展开试验性探索。他们巧妙地运用了服务分层、成本归集及个性化对标策略,针对DC层、IaaS层、PaaS层等资源,分别详尽统计并深入分析了资源单位成本、资源利用效率、能源单位成本、能源利用效率以及人员运营效率等关键指标。同时,他们还将这些内部数据与IDC、IaaS云、PaaS云等外部供应商的市场价格水平进行对照,以此全面评估并衡量自身的效率与效益水平。

IT效益评估体系的创建,使IT部门能够基于效益视角细分目标,从而驱动内部各单元逐年提升效率和效益,实现IT部门从成本中心向利润中心的思维转型。近年来,绿色数据中心理念及PUE(电源使用效率)指标的日益受到重视,正是这一转变趋势的显著体现。

需要强调的是,尽管构建了效益衡量体系,但要确保其真正有效运作,不可或缺的是详尽的数据统计与深入分析,以及关键效益指标的可视化与透明展现。众多IT组织正积极探索构建IT运维/运营大数据平台,并将可视化和AIOps理念融入其中,这些举措均紧密关联于追求IT效益的可量化评估。当然,这一系列努力也会伴随额外的投入。因此,IT组织应根据自身的规模、目标优先级及实际情况,在确有需要之时,审慎选择适宜的切入点,采取分步实施的方式,逐步构建起完善的效益衡量体系。

IT运营:让员工满意


互联网企业的繁荣与各行业“互联网+”的蓬勃发展,共同加剧了IT人才的竞争态势。如何有效吸引并留住高素质的IT人才,已成为众多IT部门亟待解决的新挑战。在追求IT员工满意度的过程中,确保用户满意与老板满意这双重基石的稳固至关重要。否则,IT部门自身的地位不稳,员工难以获得成就感,士气必然受挫,进而影响整体满意度的提升。

但即便实现了前两个满意度指标,若让IT员工每日陷入无尽的忙碌与疲惫之中,员工满意度仍会大打折扣,且绝非可持续之道。为有效提升员工满意度,我们需从多个维度进行深思与考量:

提高自动化水平:相较于运维阶段更侧重于通过自动化实现标准化,以减少故障发生,运营阶段则更为聚焦于利用自动化手段来减轻员工的重复性劳动负担,使他们能将更多的精力投入到更具价值的标准制定和技术优化工作中,从而促使IT员工从单纯的技术执行者转变为真正的工程师角色。此外,自动化还带来了显著的效益提升。随着分布式、虚拟化和云化技术的广泛普及,自动化已成为不可或缺的重要工具。在一些领先的互联网公司中,人均管理的服务器数量已经远远超越了业界公认的1:500的优质标准。

增强人性化考量:在传统运维阶段,为确保系统稳定与安全,往往在软硬件上投入巨大资源,而在此过程中,往往也无形中增加了员工工作的复杂性,人性化因素考虑不足。众多IT组织现已着手从多个维度进行改进:通过优化流程及引入创新工具,旨在减轻员工的繁重文案负担;构建场景化运维能力,提升工具的易用性,使IT人员在运维与故障排查中更加游刃有余,从而在提升IT系统稳定性的同时,形成以工作场景为核心的高效运维模式;同时,紧跟时代步伐,引入前沿技术,在确保安全与风险控制的前提下,简化IT人员的操作流程(例如,打破僵化的网络隔离限制、实现移动化运维、运用AI客服减少对简单重复问题的依赖,进而减轻员工工作负担)。

尝试并引入先进技术:在追求稳定与安全的道路上,传统IT运维在技术选择和使用上往往显得保守,这诚然有其合理性。然而,卓越的IT从业者通常对新技术充满渴望。在技术日新月异、传播与应用速度惊人的今天,若工作环境中缺乏新技术的接触与学习,IT人的技术热情将受到抑制,进而可能引发深刻的技术焦虑感,最终削弱对IT人才的吸引力和保留力。

以上从三个层次深入探讨了从IT运维向IT运营转型的精髓,尤为耐人寻味的是,这些层次间存在着一种逐步深入且相互交融的满意关系。具体而言,员工满意作为基石,自然涵盖了老板满意这一更高层次的需求;而老板满意,在本质上,也必然蕴含了对用户满意的深切关怀。进一步地,业务部门的满意则广泛涉及到了个人用户的满意,但每一层次的满意都独具特色,富含个性化的内容与追求。

实现三重满意,推动IT从“生存”迈向“繁荣”,由单纯的“维护”稳定转向创造业务价值,这要求IT管理向精细化、自动化、智能化的方向迈进。同时,必须构建多元化的数据采集体系,深化多维度的数据分析与挖掘能力,并实现全面的可视化展现。在此背景下,IT运营管理的架构也将在传统监管控运维管理的基础上,经历一系列的发展与创新,以更好地满足IT运营在用户体验、运营效率及经济效益等多方面的更高标准。

需要明确的是,IT领域涵盖了规划、设计、开发及运营等多个关键环节。我们在此主要聚焦于运营层面,但实际上,从IT运维向IT运营的跨越,绝非运营部门一己之力所能及,它呼唤着规划、管理、开发等部门的携手并进与密切协作。

因此,IT运营不仅是运维部门职能的转型,更是整个IT部门管理模式的一次深刻变革。这一变革促使IT部门的每个环节都积极投身于价值创造的洪流中,而非仅仅局限于维护“稳定”这一单一维度,从而以更广阔的视野和更全面的能力,推动IT部门向更高层次的发展。

从IT运维向IT运营的转型,实质上反映了IT组织成熟度的显著提升。若以Gartner的I&O成熟度模型为参照,IT运维主要集中于模型的前几个阶段,而逐步转向对IT运营的深入关注,则标志着IT组织已成功迈入模型的后两个阶段:Service Aligned与Business Partnership。在这一阶段,IT部门开始将自身视为业务的一部分,以客户为中心,高度重视客户体验,并致力于提升运营效率与成本效益。

从IT运维迈向IT运营,众多IT组织已踏上**,与此同时,诸多IT产品与服务的供应商亦敏锐捕捉到这一转型趋势,积极响应IT运营的需求,创新研发并推出了一系列高效的运营工具与全方位的服务。我们诚邀所有有志于深耕ITOM领域的伙伴们携手并进,秉持匠心独运、追求卓越的精神,共同打造卓越的ITOM产品与服务体系,为IT领域的运维向运营转型贡献力量,让IT不仅生存无忧,更要蓬勃发展,绽放无限精彩。





上一篇:IT运维管理是什么?
下一篇:企业架构背后的原理是"顶层设计思维"

写了  篇文章,拥有财富 ,被  人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

返回顶部