本文档是一份关于如何开展运维体系规划的资料,涵盖了运维体系梳理、敏捷开发、ITIL、DevOps、NoOps、持续集成、百度和腾讯的运维实践等多个方面的内容。文档通过多个案例和最佳实践,为读者提供了全面的运维体系规划和实施指南。
运维体系梳理 文档首先介绍了运维体系梳理的重要性,强调了运维体系在确保IT服务稳定性和高效性中的关键作用。通过引用百度文库的智慧,文档展示了多个实际案例,如百度知道研发能力的提升、携程的自动化发布体系、淘宝的应用运维等,说明了运维体系在不同企业中的应用和效果。
ITIL、DevOps和NoOps 文档详细介绍了ITIL、DevOps和NoOps的概念和应用。ITIL是一组广为接受的IT管理流程管理框架,主要包括事件管理、问题管理、变更管理、发布管理和配置管理等流程。DevOps源于持续集成,强调开发推动的产品更新模式,通过自动化完成软件版本的编译、打包和部署。NoOps是DevOps的扩展,主张IT人员不应参与开发周期,开发人员负责所有架构设计、容量规划和性能优化等工作,目标是通过去除人为干预和交接来消除停机状况并提高性能。
持续集成 文档深入探讨了持续集成的概念和实践,强调了持续集成在软件开发中的重要性。持续集成要求开发人员频繁提交工作产品,通常每天至少一次,通过自动化构建(包括编译、发布、自动化测试)来验证,从而尽早发现集成错误。文档列举了持续集成的要素和原则,如统一的代码库、自动构建、自动测试、快速构建、模拟生产环境的自动测试等。
百度和腾讯的运维实践 文档详细介绍了百度和腾讯的运维实践,展示了两个公司在运维体系规划和实施方面的成功经验。 百度体系架构: - 系统部:负责操作系统定制、Linux内核分析、网络调优、硬件性能优化、安全和防攻击能力提升等。 - 运维部:负责搜索引擎及产品线上运营,实现稳定运行和快速访问,涉及高可靠性大规模机群自动化管理平台、高性能Mysql数据库集群设计与调优、海量数据分析与监控等。 - 质量部:负责所有产品的质量保证、测试框架设计与软件工具开发、过程改进等。 - 信息技术工程部:负责公司网络平台、IT基础设施的规划、建设、运维,信息安全管理策略、流程的制定、建设、监控,以及IT应用系统的规划、建设、推广、运维。
腾讯组织架构: - 技术工程事业群(TEG):包含技术运营线和搜索平台线,运营亚洲最大的网络、服务器集群和数据中心,提供基础架构云运营平台、云数据处理平台、互联网海量应用支撑服务平台等。 - 云平台大生态:腾讯开放战略分三层,技术工程事业部建立云平台,为开发者提供基础服务,包括QQ统一登录、消息推送、Q点支付、云服务托管、广告、数据分析等。
最佳实践和意义 文档总结了IT管理业界的最佳实践,强调了整个集团有尽职尽责、一体化的IT组织,统一向CIO汇报,CIO直接向CEO汇报并参与企业规划和决策。最佳实践包括: - 在集团层面定义IT战略,在业务单元层面实施IT战略。 - 确保与整体业务目标一致,与业务需求相关。 - 在集团层面设计总体架构,发布技术/数据标准和指导方针,确保可相互操作性和维护的便利。 - 应用开发和运营应被分离,新系统的维护中与系统所有者保持近距离接触,旧系统进行远程维护。 - 为效率的提高而集中开发全公司范围内的应用,新应用不稳定时与系统所有者保持接近以确保反馈。 - 依靠应用,但可能的话在集团层面进行管理,更强的谈判能力和提高战略性采购。
IT团队的职责体系和培养方向 文档还介绍了IT团队的职责体系和培养方向,包括管理领域和专业领域的职位设置,如IT总监、IT副总监、部门经理、部门副经理、经理助理、项目经理、项目主管、项目助理等。文档强调了IT员工的成长体系,包括系统管理员、网络管理员、数据库管理员、程序员、行业分析师、系统架构师等职位,以及向专业管理领域发展的路径。
这份文档为读者提供了全面的运维体系规划和实施指南,通过多个实际案例和最佳实践,展示了运维体系在不同企业中的应用和效果。文档强调了ITIL、DevOps和NoOps的概念和应用,持续集成的重要性,以及百度和腾讯在运维实践中的成功经验。通过这些内容,读者可以更好地理解和实施运维体系,提升IT服务的稳定性和高效性。
|